Sie sind auf Seite 1von 29

Probleme mit der Hyperlinkmatrix

Wenngleich die Hyperlinkmatrix H den Zusammenhang zwischen den von Google indizier-
ten Internetseiten widerspiegelt, ergeben sich Schwierigkeiten, von denen wir folgende drei
genauer betrachten werden:
1. Es ist unwahrscheinlich, dass ein Internetuser sich durch bloßes Klicken durch das gesamte
Web bewegen kann. Vielmehr gibt es mehrere große Internetseiten-Cluster, die nicht mit-
einander verlinkt sind. In diesem Zusammenhang spricht man von einem nicht stark zu-
sammenhängenden Webgraphen.
2. Es gibt Sackgassen, so genannte dangling nodes, aus denen ein Internetuser durch bloßes
Klicken nicht mehr „herauskommt“.
3. Darüber hinaus wird die Matrix H der Tatsache nicht gerecht, dass ein User sich nicht nur
durch Klicken durch das Internet bewegt.

Reduzible Hyperlinkmatrix (Nicht stark zusammenhängender Webgraph)


Das Theorem von Perron-Frobenius erfordert, dass die Matrix H irreduzibel sein muss, da-
mit ein eindeutig (normierter) Fixvektor existiert.
Rufen wir uns an dieser Stelle einmal ins Gedächtnis zurück, wann eine Matrix
reduzibel ist:

Eine Matrix heißt reduzibel, wenn es nach Umordnung der Basisvektoren von
ein gibt, so dass invariant
unter A ist, d.h. gilt.

Um diese abstrakte Definition mit Leben zu erfüllen, geben wir an dieser Stelle ein Beispiel
einer reduziblen Hyperlinkmatrix und leiten daraus eine Eigenschaft der Webstruktur ab, die
gelten muss, damit die Hyperlinkmatrix H irreduzibel ist und folglich die Voraussetzungen
für das Theorem von Perron-Frobenius erfüllt.
Betrachten wir folgende Hyperlinkmatrix H5:

Bei genauerer Betrachtung wird man feststellen, dass folgender Unterraum invariant unter

H5 ist: . H5 ist also reduzibel. Der genannte

Unterraum ist zugleich der Eigenraum der Matrix zum Eigenwert 1, also . Hie-

1
raus ist ersichtlich, welche Schwierigkeit die Reduzibilität der Hyperlinkmatrix mit sich
bringt: Die Eindeutigkeit des gesuchten Fixvektors geht verloren.
Fertigt man eine Skizze vom zugehörigen Webgraphen an, wird man auf einen Blick einer
Charakteristik dieses Mini-Webs gewahr:

.
Die Internetseiten W1 und W2 sind nicht mit den übrigen drei Internetseiten verbunden. In
der Graphentheorie spricht man in diesem Fall von einem nicht stark zusammenhängenden
Webgraphen; das bedeutet, anschaulich gesprochen, dass man durch bloßes Klicken von einer
beliebigen Internetseite aus nicht jede andere Webseite im Internet erreichen kann.
Damit eine Hyperlinksmatrix H also irreduzibel ist, darf sie, grob vereinfacht, nicht folgende
Gestalt haben:

, wobei A und C quadratische Matrizen sind1.

Die Lösung dieses Problems folgt einem intuitiven Ansatz und wird weiter unten im Zu-
sammenhang mit der spontanen URL-Eingabe erläutert.

Bevor wir uns im nächsten Schritt genauer mit den dangling nodes beschäftigen, nehmen
wir nun wieder unser einfaches Beispiel her:

Und rufen wir uns die Hyperlinkmatrix H4 ins Gedächtnis zurück, die dieses Mini-Web re-
präsentiert:

1
Die Anzahl der quadratischen Matrizen, die sich über die Hauptdiagonale erstrecken, ist nicht auf zwei Matri-
zen festgelegt.

2
Dangling Nodes (Internetseiten ohne Outlinks)
Es gibt zahlreiche Webseiten ohne weiterführende Hyperlinks, z.B. .pdf-, .jpg-, .mkv-
Dateien, die eben auch als Webseiten aufgefasst werden. Dadurch entstehen Sackgassen, so
dass nicht mehr gewährleitstet ist, dass ein User sich durch das gesamte Web klicken kann,
ohne die Hand von der Maus zu nehmen, wie es die Hyperlinkmatrix H suggeriert.
Stellen wir uns vor, die Internetseite W3 in unserem Mini-Web wäre eine solche Sackgasse,
dann würde die entsprechende Graphik folgendermaßen aussehen:

Auch unsere Hyperlinkmatrix H erfährt dadurch eine folgenreiche Änderung:

Die Spalte der dangling-node-Webseite hat nur Nulleinträge, was zur Folge hat, dass die
Hyperlinkmatrix H nicht mehr spaltenstochastisch, sondern nur noch spaltensubstochastisch
ist. Dadurch ist die Konvergenz der Matrix nicht mehr gesichert.
Um eine Lösung für dieses Problem zu finden, reicht es, sich in die Lage des Internetusers
zu versetzen: Dieser wird in solch einem Fall schlichtweg eine beliebige URL eingeben, was,
auf unser Mini-Web angewendet, folgende dangling-node-Matrix D ergibt:

.2

2
So abwegig es erscheinen mag, darf man beim Aufstellen der dangling-node-Matrix nicht außer Acht lassen,
dass die Möglichkeit besteht, dass ein User dieselbe Internetadresse abermals eingibt.

3
Die Summe aus der Hyperlinkmatrix H und der dangling-node-Matrix D liefert eine spal-
tenstochastische Matrix S, deren Konvergenz wiederum gesichert ist:

Aus dem eben beschriebenen Lösungsansatz ergibt sich unmittelbar ein Phänomen, das nicht
nur im Falle einer Sackgasse auftritt: Ein Internetuser gibt zu einem beliebigen Zeitpunkt eine
neue Internetadresse ein.

Spontane Eingabe einer Internetadresse


Theoretisch gesehen hat ein User auf jeder Webseite die Möglichkeit, die URL jeder Web-
seite einzugeben – auch die URL der Seite, auf der er sich befindet. Damit scheint jede Inter-
netseite von überall aus mit der Wahrscheinlichkeit angewählt werden zu können. Auf die-

ser Annahme beruht die Transformationsmatrix T, die für unser Mini-Web folgende Gestalt
hat:

Da ein User beim Surfen sowohl den Hyperlinks folgt – sich also von Webseite zu Webseite
klickt – als auch dann und wann eine neue Internetadresse eingibt, müssen die spaltenstochas-
tische Matrix S und die Transformationsmatrix T summarisch miteinander in Beziehung ge-
setzt werden. Dabei ist jedoch zu bedenken, dass der besagte User mit einer gewissen Wahr-
scheinlichkeit α ( der Hyperlinkstruktur des Webs folgt. Für unser aus vier
Internetseiten bestehendes Web erhalten wir damit folgende Google-Matrix G4:

4
Da Google laut eigenen Angaben einen Wahrscheinlichkeitsfaktor verwendet, lau-
tet die Google-Matrix für unser Mini-Web:

Denken wir an dieser Stelle noch einmal zurück an das anfangs geäußerte Problem: Der
Webgraph ist in der Regel nicht stark zusammenhängend und daher die Hyperlinkmatrix H
reduzibel. Wir finden nun, dass auch dieses Problem durch das Heranziehen der Transforma-
tionsmatrix T gelöst wird, wie bereits die Gestalt unserer (4x4)-Matrix zeigt.

Mit der Potenzmethode zur Konvergenz der Google-Matrix

Bevor wir die Konvergenz der Google-Matrix ge-


nauer betrachten und zuletzt auch beweisen, wollen wir uns noch einmal vergegenwärtigen,
was ihre Einträge bedeuten: Jeder Eintrag gij der Matrix gibt an, mit welcher Wahrscheinlich-
keit ein Internetuser von der Webseite Wj zur Webseite Wi gelangt. Auf welche Weisen das
geschehen kann, ist durch die ausführliche Problembehandlung, die die natürliche Hyper-
linkmatrix H nach sich zieht, zuvor bereits ausführlich geschildert worden.

Die Potenzmethode
Nun ist es jedoch auch möglich, über „Umwege“ von der einen zur anderen Webseite zu ge-
langen. Nehmen wir wieder unser Mini-Web von vier Internetseiten als Beispiel, können wir
die Möglichkeiten, in zwei Schritten von der Seite W2 zu W4 zu gelangen, in einem Baumdia-
gramm darstellen:

5
Nach den Pfadregeln ist die Wahrscheinlichkeit, in zwei Schritten von W 2 zu W4 zu gelan-
gen, gleich der Summe der Wahrscheinlichkeiten, im ersten Schritt über eine der vier Websei-
ten W1 bis W4 zu besuchen:
.

Sehen wir uns die Summe genauer an, können wir erkennen, dass sich dahinter die Matri-
zenmultiplikation der zweiten Spalte mit der vierten Zeile unserer Google-Matrix G4 verbirgt:
;

Somit können wir gleich allgemein die k-fache Multiplikation der Google-Matrix G mit sich
selbst, als k-fache Fortbewegung eines Users im Internet durch Klicken oder URL-Eingabe
interpretieren. Die jeweiligen Einträge der k-mal potenzierten Google-Matrix geben
somit die Wahrscheinlichkeit an, mit der ein Surfer innerhalb von k Schritten von der
Webseite Wj zur Webseite Wi gelangt.
Stellen wir uns nun vor, dass ein Internetuser sich unendlich lang durch das Web fortbewegt,
so besagen die Gesetze der großen Zahlen aus der Stochastik, dass die relative Häufigkeit, mit
der er eine Internetseite besucht, sich der Wahrscheinlichkeit, diese Seite zu besuchen,
annähert. Anders formuliert: Die Wahrscheinlichkeit, die Webseite Wi zu besuchen, sollte
sich mit steigender Zahl der Klicks und URL-Eingaben stabilisieren – egal, wo im Netz man
begonnen hat zu surfen:

Sollte die Google-Matrix also konvergieren, so wären die Spalten der „Grenzwert-
Matrix“ identisch. Diese Methode, die Google-Matrix mittels ihrer Potenzierung konvergieren
zu lassen, trägt den Namen Potenzmethode und hängt eng mit dem Ansatz von Page und
Brink zusammen, der im Folgenden vorgestellt werden soll.

6
Rekursiver Ansatz
Wir erinnern an den eingangs erläuterten Ansatz, den popularity score einer Internetseite Wk
durch die Wichtigkeitswerte der auf Wk verweisenden Internetseiten Wi zu ermitteln. Dieser
Sachverhalt genügte der Gleichung , woraus ein Eigenwertproblem resultierte:

mit für und .

Page und Brink haben unter Ausnutzung der Konvergenz der Matrix G diesen Ansatz in fol-
gende Rekursion umgeändert:

mit Startvektor .

Den Startvektor kann man sich recht intuitiv erklären: Jeder Eintrag entspricht der
Wahrscheinlichkeit die Webseite Wi unter Internetseiten zu Beginn des Surfens anzu-
steuern.
Führt man die Rekursion aus, so ergibt sich:
.
Der rekursive Ansatz von Page und Brink hängt somit eng mit der zuvor erläuterten Po-
tenzmethode zusammen.

Konvergenz der Google-Matrix am Beispiel


Wenden wir die Potenzmethode auf unsere überschaubare Google-Matrix an, so stellen
wir fest: Sie konvergiert in der Tat und sogar recht schnell. Mit Maple erhält man folgende
Resultate3:

Bei einer Genauigkeit von fünf Stellen nach dem Komma stabilisiert sich die Google-Matrix
nach bereits 12 Iterationen und eine Aufsummierung der Einträge pro Spalte ergibt, dass der
Grenzwert der Matrix G4 spaltenstochastisch ist.

3
Wir haben uns hierbei mit einer numerischen Berechnungsgenauigkeit von 10 -5 zufriedengegeben.

7
Aus dem stabilen Grenzwert kann man nun auch den popularity score bzw. importance sco-
re jeder Internetseite unseres Mini-Webs ablesen:

Internetseite W1 W2 W3 W4
Rang 3 4 1 2

Beweis der Konvergenz der Google-Matrix


Es gibt viele Möglichkeiten, die Konvergenz der Google-Matrix zu beweisen, u.a. mit Hilfe
der Spektraltheorie, deren erste Grundlagen wir bereits erläutert haben. Wir ziehen jedoch den
einfacheren Weg vor und führen den Konvergenzbeweis mit Hilfe des Banachschen Fix-
punktsatzes, den wir an dieser Stelle in Erinnerung rufen:
Sei X eine (nichtleere) abgeschlossene Teilmenge eines vollständigen metrischen Raumes
und φ eine kontrahierende Selbstabbildung von X; für alle gelte also:
mit .
Dann besitzt φ genau einen Fixpunkt in X.

Beweis der Konvergenz der Google-Matrix


Wir betrachten die Menge mit der von der
Norm induzierten Metrik .
Da der , ausgestattet mit der -Norm, ein Banachraum, also ein normierter vollständi-
ger Raum ist, ist auch die Menge vollständig. Da X zugleich beschränkt ist, enthält
sie nach dem Auswahlprinzip von Bolzano-Weierstraß eine konvergente Teilfolge, deren
Grenzwert auf Grund der Vollständigkeit von X ebenfalls in X liegt. Damit ist X auch abge-
schlossen.
Es bleibt also zu zeigen, dass die definierte Google-Matrix eine kontrahierende Ab-
bildung beschreibt. Auf Grund ihrer Linearität gilt :
.
Hinsichtlich der Transformationsmatrix folgt wegen der Eigenschaft :

Daraus folgt : .
Wenden wir darauf nun die Metrik an, ergibt sich:
,
denn .
Die Google-Matrix G beschreibt also eine kontrahierende Abbildung und besitzt folglich ei-
nen eindeutigen, positiven Fixvektor mit Norm 1.

8
Fehlerabschätzung
Natürlich möchte man gern wissen, wie genau die approximierte Lösung ist, d.h. um wie
viel Prozent sie vom eigentlichen Fixvektor abweicht. Dazu nutzt man die folgenden beiden
Abschätzungen, die aus dem Banachschen Fixpunktsatz hervorgehen und für den Page-
Ranking-Ansatz folgende Gestalt haben:

1. A-priori-Abschätzung für den n-ten Fehler:

2. A-posteriori-Abschätzung für den n-ten Fehler:

Wir wenden die Abschätzungen nun auf unser Mini-Web an, dessen zugehörige Google-
Matrix bereits nach 12 Iterationen einen stabilen Fixvektor bei gegebener Berechnungsgenau-
igkeit geliefert hat.

Mit , ergibt sich:

1. A-priori-Abschätzung:

2. A-posteriori-Abschätzung:

Bereits an der A-priori-Abschätzung kann man sehen, dass der Fehler für den intuitiv ange-
setzten Startvektor unerfreulich groß ist. Nimmt man jedoch die Differenz zweier aufei-
nanderfolgender Vektoren als Startvektor, sind die Abweichungen bedeutend geringer.
Mit und bekommen wir:
1. A-priori-Abschätzung:

2. A-posteriori-Abschätzung:

9
Einfluss verschiedener Parameter auf die Google-Matrix

Betrachten wir noch einmal die Zusammensetzung der Google-Matrix:


.
Der Term gibt bereits Aufschluss darüber, dass die Gestalt und damit
der gesuchte Fixvektor von G u.a. von den folgenden zwei Faktoren abhängen: der Hyper-
linkmatrix H sowie dem Skalar α.
Der Einfluss der Matrix H ist in zweierlei Hinsicht zu begründen: Erstens unterliegt die Hy-
perlinkstruktur des World Wide Web steter Veränderung, die sich durch die Suchergebnisse
der crawler-Programme automatisch auf die Google-Matrix auswirkt. Zweitens ist es bei ge-
nauerer Überlegung fraglich, ob alle Links auf einer Internetseite tatsächlich mit derselben
Wahrscheinlichkeit von einem User angeklickt werden.
Die Wahl des Parameters α, der einschätzt, inwieweit User sich beim Surfen von der Hyper-
linkstruktur des Webs leiten lassen, wird sich bei den folgenden Ausführungen als maßgebend
für den Erfolg des PageRanking-Verfahrens herausstellen.

Der intelligente Surfer


Die Hyperlinkmatrix H spiegelt idealisierte Verhältnisse wider, denn sie geht davon aus,
dass User jeden Link auf einer Internetseite Wi mit derselben Wahrscheinlichkeit ankli-

cken4 - in diesem Fall spricht man von einem random user. Dagegen klicken wir beim Surfen
eher auf die Links, die uns inhaltlich interessant erscheinen und relativ am Anfang einer Web-
seite stehen – in diesem Zusammenhang spricht man von einem intelligent surfer.
PageRank-Forscher verwenden verschiedene heuristische Methoden, um die Hyperlinkmat-
rix H so anzupassen, dass sie die Position eines Outlinks auf der Webseite, seine Beschrei-
bung sowie die inhaltliche Ähnlichkeit zweier verlinkter Seiten berücksichtigt.
Schauen wir uns an dieser Stelle einmal an, welche Auswirkungen allein die Position eines
Outlinks für die Konvergenz der Google-Matrix haben kann. Dazu betrachten wir wiederum
unser Mini-Web und machen folgende Annahme: Der Outlink, der an erster Stelle auf einer
Internetseite steht, werde vom User mit doppelt so großer Wahrscheinlichkeit angeklickt als
die übrigen Links. Dabei seien die im folgenden Schema rot hervorgehobenen Links diejeni-
gen, die an vorderster Position stehen5:

4
Es sei daran erinnert, dass die Anzahl der Outlinks auf einer Webseite Wi bezeichnet.
5
Der Outlink von W3 wird nicht gesondert hervorgehoben, da es der einzige der Internetseite ist.

10
.
Unsere Hyperlinksmatrix H nimmt dadurch folgende Gestalt an:

Lassen wir dieses Resultat in unsere Google-Matrix einfließen und setzen wiederum
, erhalten wir folgende Ergebnisse:

Neben der Beobachtung, dass die Konvergenz bei derselben numerischen Berechnungsge-
nauigkeit wie zuvor erst nach 23 Iterationen statt nach 12 eintritt, lässt sich feststellen, dass
die drei Internetseiten W1, W2 und W3 unseres Mini-Webs ihren Rang getauscht haben:

Internetseite W1 W2 W3 W4
Rang 1 4 2 3

Dadurch ist bereits in kleinem Rahmen erwiesen, dass die Anpassung der Hyperlinkmatrix
H an das Surfverhalten eines intelligenten Users große Auswirkungen auf das Ranking-
Ergebnis haben kann.

Mehr Klicken oder mehr Tippen – der Parameter α


Der Parameter α gibt, wie zuvor erwähnt, Auskunft darüber, wie man das Surfverhalten ei-
nes Internetusers einschätzt: Je höher dieser Parameter gewählt wird, desto eher bewegt sich
der User mit Hilfe seiner Maus im Web umher.

11
Wie man vermuten kann, wird sich die Modifikation von α auf verschiedene Weise auswir-
ken. Da eine niedrige Iterationsrate für die Konvergenz der Google-Matrix sowie ein zuver-
lässiges Ranking-Ergebnis entscheidend für Googles Erfolg sind, wollen wir nun die Auswir-
kungen von α auf diese beiden Aspekte betrachten. Dazu nehmen wir uns folgende Webstruk-
tur von sieben Internetseiten:

mit zugehöriger Google-Matrix .

Lässt man die Matrix für verschiedene Werte von α konvergieren, erhält man folgende Er-
gebnisse bei einer Berechnungsgenauigkeit von 10-5:
α 0,1 0,3 0,5 0,85 0,95
Iterationen bis
6 11 18 73 244
zur Stabilität

Fixvektor

Der Tabelle kann man zwei wichtige Aspekte entnehmen, die dem Einfluss des Parameters α
zugeschrieben werden:
1. Die Konvergenzgeschwindigkeit nimmt bei steigendem α ab, d.h. es werden mehr Itera-
tionen benötigt, um einen stabilen Fixvektor zu erhalten.
2. Je kleiner α ist, desto weniger deutlich unterscheiden sich die Ranking-Ergebnisse. Dies
ist dadurch zu erklären, dass bei kleinem α der Transformationsmatrix , deren Einträge
alle identisch sind, ein größerer Einfluss zugeschrieben wird.

12
Der Zusammenhang zwischen der Konvergenzgeschwindigkeit und dem Parameter α lässt
sich folgendermaßen graphisch darstellen:

Schauen wir uns die einzelnen Fixvektoren genauer an, können wir feststellen, dass die
Ranking-Werte für jede Wahl des Parameters α gleich bleiben. Jedoch ist dies durch die klei-
ne Größe unseres Mini-Webs zu begründen. Ein Internet mit einer erheblich größeren Anzahl
von Webseiten weist mit steigendem Parameter α Änderungen in den Page-Rank-Ergebnissen
auf.

Zuletzt steht noch die Frage im Raum, weshalb Google den Skalar möglicherweise auf
setzt. Werfen wir dazu noch einmal einen Blick auf die obige Graphik, so ist im
Punkt D erkennbar, dass die Steigung der Kurve bis zu diesem Punkt verhältnismäßig gering
ist, danach jedoch rasant in die Höhe schnellt. Dies führt zu folgender Vermutung: Für einen
Wert des Skalars bis zu ist die Konvergenzgeschwindigkeit der Google-Matrix für
die Entwickler noch akzeptabel. Darüber hinaus ist der Rechenaufwand für die von Google
gesetzten Zwecke womöglich zu hoch.

13
Didaktische Analyse

Voraussetzungen:

14
Entwurf einer möglichen Unterrichtsreihe

Einstieg

Zunächst sollen die Schüler sich mit dem Aufgabentyp und den damit verbundenen mathe-
matischen Techniken vertraut machen, die später auch beim Page-Ranking-Ansatz von Goog-
le zur Anwendung kommen: Dazu soll das Arbeitsblatt 1 (s. Anhang) dienen. Im Folgenden
werden die einzelnen Aufgaben und Vorgehensweisen näher erläutert.
Es ist sinnvoll, nach dem Lesen des Einleitungstextes mit den Schülern die Abbildung zu
besprechen. Sie werden sich voraussichtlich zunächst eng an die Abbildung halten und die
prozentuale Kundenbewegung für jedes Unternehmen beschreiben. In diesem Zusammenhang
sollten die Fachbegriffe gerichteter Graph bzw. Übergangsgraph eingeführt werden6, wobei
darauf zu achten ist, dass die Begriffe inhaltlich verstanden werden: Weshalb ist der Graph
gerichtet? Was für Übergänge gibt er an?
Desweiteren sollte die Abbildung nicht rein deskriptiv behandelt werden: Hier bietet es sich
an, grundlegende Begriffe der Wahrscheinlichkeitslehre heranzuziehen: Die Prozentsätze an
den Graphenkanten entsprechen den relativen Übergangshäufigkeiten, woraus sich die jewei-
ligen relative Wahrscheinlichkeiten ermitteln lassen. Diese Überlegungen lassen sich bereits
durch die Frage anregen, wie hoch die Wahrscheinlichkeit ist, dass ein E-Plus-Kunde zu Vo-
dafone wechselt usw.
Aufgabe a) des Arbeitsblattes 1 hat zum Ziel, dass die Schüler für jedes Unternehmen eine
rekursive Gleichung zur Ermittlung der Kundenzahlen im n-ten Jahr aufstellen. Für die ersten
beiden Jahre gelangen sie zu folgenden Gleichungen und Ergebnissen7:
, ,
, ,
, .
Daraus lassen sich die allgemeinen rekursiven Gleichungen gewinnen:
,
,
.

Bereits an dieser Stelle, spätestens aber mit Aufgabe b) lässt sich der Begriff Iteration ein-
führen und in Zusammenhang mit den rekursiven Definitionen bringen. Durch die Berech-
nung der Kundenverteilungen nach 5, 10 und 20 Jahren kann den Schülern der Vorteil einer

6
Die Begriffe Kanten und Knoten sind ebenso einzuführen, da sie wesentlich für die Graphentheorie sind.
7
Der Anfangsbuchstabe jedes Unternehmens wird hier als Variable für selbiges verwendet.

15
Tabellenkalkulation verdeutlicht werden – die Berechnung mit dem Taschenrechner ist deut-
lich aufwendiger als z.B. das Pull-down-Verfahren bei Excel.
Aufgabe b) hat ebenfalls zum Ziel, dass die Schüler eine Stabilisierung der Kundenvertei-
lung nach bereits 15 Jahren feststellen können – Excel liefert folgende Ergebnisse und graphi-
sche Veranschaulichung der Kundenanteile:
Vodafone T-Mobile E-Plus

Beginn 1/3 1/3 1/3


1. Jahr 43,33% 30,00% 26,67%
2. Jahr 48,67% 28,00% 23,33%
3. Jahr 51,53% 26,80% 21,67%
4. Jahr 53,09% 26,08% 20,83%
5. Jahr 53,94% 25,65% 20,42%
6. Jahr 54,40% 25,39% 20,21%
7. Jahr 54,66% 25,23% 20,10%
8. Jahr 54,81% 25,14% 20,05%
9. Jahr 54,89% 25,08% 20,03%
10. Jahr 54,94% 25,05% 20,01%
11. Jahr 54,96% 25,03% 20,01%
12. Jahr 54,98% 25,02% 20,00%
13. Jahr 54,99% 25,01% 20,00%
14. Jahr 54,99% 25,01% 20,00%
15. Jahr 55,00% 25,00% 20,00%
16. Jahr 55,00% 25,00% 20,00%
17. Jahr 55,00% 25,00% 20,00%
18. Jahr 55,00% 25,00% 20,00%
19. Jahr 55,00% 25,00% 20,00%
20. Jahr 55,00% 25,00% 20,00%

60,00%

50,00%

40,00%
Vodafone
30,00%
T-Mobile
20,00% E-Plus

10,00%

0,00%
0 5 10 15 20 25

Die Stabilisierung der Kundenverteilung kann den Schülern auch dadurch verdeutlicht wer-
den, dass das prozentuale Wachstum graphisch veranschaulicht wird:

16
40,00%
30,00%
20,00%
Vodafone
10,00%
T-Mobile
0,00%
E-Plus
-10,00% 0 10 20 30

-20,00%
-30,00%

Durch den Vergleich beider Abbildungen lässt sich die Schlussfolgerung ziehen, dass die
Kundenzahlen genau dann stagnieren, wenn kein Wachstum mehr vorliegt8. Auch der algeb-
raische Zusammenhang mit den rekursiven Gleichungen muss verdeutlicht werden: Die app-
roximierte Lösungsmenge des zugehörigen linearen Gleichungssystems verändert sich ab ei-
nem gewissen Punkt nicht mehr9.
Abschließend zur Einführung sollen die Schüler dieselben Rechnungen mit einer anderen
Ausgangsverteilung durchführen, wie es Aufgabe c) von ihnen verlangt. Sie werden dabei zu
folgenden Ergebnissen kommen:
Vodafone T-Mobile E-Plus

Beginn 40% 35% 25%


1. Jahr 46,50% 31,00% 22,50%
2. Jahr 50,15% 28,60% 21,25%
3. Jahr 52,22% 27,16% 20,63%
4. Jahr 53,39% 26,30% 20,31%
5. Jahr 54,07% 25,78% 20,16%
6. Jahr 54,46% 25,47% 20,08%
7. Jahr 54,68% 25,28% 20,04%
8. Jahr 54,81% 25,17% 20,02%
9. Jahr 54,89% 25,10% 20,01%
10. Jahr 54,93% 25,06% 20,00%
11. Jahr 54,96% 25,04% 20,00%
12. Jahr 54,98% 25,02% 20,00%
13. Jahr 54,99% 25,01% 20,00%
14. Jahr 54,99% 25,01% 20,00%
15. Jahr 55,00% 25,00% 20,00%
16. Jahr 55,00% 25,00% 20,00%
17. Jahr 55,00% 25,00% 20,00%
18. Jahr 55,00% 25,00% 20,00%

8
Auch durch die eigenständige Berechnung des Wachstums für jedes Unternehmen in den ersten beiden Jahren
können Schüler zu dieser Schlussfolgerung gelangen.
9
Besonders Schülern, die im MU noch keine Erfahrungen mit Grenzwerten hatten, ist deutlich zu machen, dass
die Werte sich sehr wohl noch ändern, wenn auch nur im Minimalbereich. Eine Vergrößerung der Spanne für
die Berechnungsgenauigkeit kann dies anschaulich machen.

17
19. Jahr 55,00% 25,00% 20,00%
20. Jahr 55,00% 25,00% 20,00%
Die graphischen Veranschaulichungen der Ergebnisse und des Wachstumsverhaltens sind
ähnlich zu den vorigen:
60%
50%
40%
Vodafone
30%
T-Mobile
20%
E-Plus
10%
0%
0 5 10 15 20 25

20,00%

15,00%

10,00%
Vodafone
5,00%
T-Mobile
0,00%
E-PLus
0 5 10 15 20 25
-5,00%

-10,00%

-15,00%

Durch den Vergleich mit ihren Ergebnissen aus Aufgabe b) sollen die Schüler dazu ermutigt
werden, folgende Hypothese aufzustellen: Die Kundenverteilung pendelt sich nach einer ge-
wissen Zeit derart ein, dass 55% der Kunden Vodafone als Dienstleister beanspruchen, 35% -
Mobile und 25% E-Plus, egal wie die Kunden zu Beginn unter den drei Anbietern verteilt
sind.
Dabei ist darauf zu achten, dass die Schüler folgende Aspekte verstehen: Eine Stagnierung
der Kundenverteilung bedeutet nicht, dass es keine Kundenbewegung zwischen den Dienst-
leistern mehr gibt. Darüber hinaus stellt sich die unveränderliche Verteilung nicht konsequent
nach 15Jahren ein, wie es beide Beispiele suggerieren: Dieser Irrtum kann leicht ausgeräumt
werden, wenn die Schüler verschiedene Anfangsverteilungen selbst wählen.10

Folgende Ziele sollen im Einstieg erreicht werden: Die Schüler kennen nach dieser Sequenz
die Begriffe gerichteter Graph, Übergangsgraph, Iteration und können sie erklären. Sie in-

10
Vor allem abstruse Verteilungen sollten ausprobiert werden: Wenn E-Plus zu Beginn 100% der Kunden hat,
stagniert die Verteilung bei den gleichen Werten nach bereits 14 Jahren.

18
terpretieren die prozentualen Angaben an den Kanten des Übergangsgraphen als relative
Wahrscheinlichkeit und drücken den Sachverhalt durch lineare Gleichungen aus. Die Schüler
erkennen, dass Iterationen durch rekursive Gleichungen ausgedrückt werden, und berechnen
die Ergebnisse mit Hilfe eines Programms für Tabellenkalkulationen. Sie verstehen, dass für
die gegebene Situation die approximierte Lösungsmenge des zugehörigen linearen Glei-
chungssystems ab einem gewissen, aber nicht festgelegten Zeitpunkt unverändert bleibt und
von den Anfangswerten unabhängig ist.
Darüber hinaus ist es erstrebenswert, in der Sekundarstufe II bereits Begriffe wie Ausgangs-
und Grenzverteilung (Qualifikationsphase) sowie Grenzwert (Einführungsphase) auf die be-
stehenden Sachverhalte anzuwenden, um eine bewusste Vernetzung der Analysis und Sto-
chastik zu erzielen. Die Anwendung von Matrizen ist an dieser Stelle noch nicht notwendig.

Von der Idee des page ranking zu seiner mathematischen Formulierung


In der nächsten Sequenz steht bereits das eigentliche Thema im Mittelpunkt. Zu Beginn ist
eine Hinführung zum Thema notwendig, die auf verschiedene Weisen vorgenommen werden
kann: Schüler benutzen bei Internetrecherchen selbst Suchmaschinen und wählen unter den
Suchergebnissen (die ersten) aus. Darüber hinaus findet man im Internet zahlreiche Videos,
die Vorschläge zur Verbesserung des „Listenplatzes“ bei der Google-Anzeige machen. Die
breite Präsenz des Themas im Alltag und der Erfolg des page ranking scheinen genug Poten-
tial zu haben, um das Interesse der Schüler daran auch für eine mathematische Betrachtung
zumindest zu gewinnen.

Es ist zu überlegen, die Schüler erst einmal selbst Ideen sammeln zu lassen, nach welchen
Kriterien die Bedeutung von Internetseiten ermitteln werden können. Dies kann in einem Un-
terrichtsgespräch geschehen, aber auch interaktiver angeregt werden: Insofern man über aus-
reichende Programmierungs- und Layoutgestaltungskenntnisse verfügt, kann man selbst ein
Mini-Internet von wenigen Seiten (ca. vier) erstellen und seine Schüler direkt am PC Ideen
entwickeln lassen. Der Nachteil besteht hierin, dass die Linkstruktur des Mini-Internets den
Schülern nicht vor Augen schwebt, sondern gedanklich nachvollzogen werden muss. Eine
weitere Möglichkeit besteht, große Karteikarten als Internetseiten vorzustellen und ihre Link-
struktur durch Bindfäden zu konkretisieren – hierbei kann eine farbliche Markierung der En-
den dazu dienen, die Verweisrichtung eines Links zu kennzeichnen.
Mit großer Sicherheit werden Schüler – besonders bei letzterer Variante – sowohl inhaltliche
Kriterien nennen als auch solche, die auf den Zusammenhang der Internetseiten untereinander
Bezug nehmen. Diese Ansätze sind ausreichende Grundlage dafür, den Schülern anschließend

19
die Vorgehensweise von Suchmaschinen bei der Indizierung von Webseiten vorzustellen. In
diesem Zusammenhang sollten die Begriffe web crawling sowie content score und popularity
score genannt werden, da sie sich in entsprechender Fachliteratur eingebürgert haben. Ob dies
alles durch einen dem Schülerniveau entsprechenden, informativen Sachtext oder durch einen
Lehrervortrag geschieht, bleibt freie Wahl, wogegen hervorgehoben werden muss, dass letzte-
re Variante den Vorteil birgt, auf die Ideen der Schüler unmittelbar eingehen zu können.
An dieses inhaltliche Vorspiel muss sich sodann die mathematische Behandlung des
popularity score anschließen, für den die Linkstruktur des Internets maßgebend ist.

In der ersten Aufgabe des Arbeitsblattes 2 sollen die Schüler ihre zuvor gewonnen Kenntnis-
se anwenden und ein entsprechendes lineares Gleichungssystem aufstellen. Dies wird sich
anhand des Übergangsgraphen leicht bewerkstelligen lassen, wenn die Schüler ausreichend
sicher im Umgang mit diesem Typ der Transferaufgabe sind. Es können sich jedoch Schwie-
rigkeiten in der Mittelstufe einstellen, da es sich hier um einen auf vier Knoten erweiterten
Graphen handelt, an dessen Kanten darüber hinaus die prozentualen relativen Übergangs-
wahrscheinlichkeiten nicht notiert sind.
Als weiterführende Aufgabe allein für die Oberstufe (Qualifikationsphase) ist die Aufgabe
b) gedacht: Sie setzt voraus, dass die Schüler bereits so viele Kenntnisse besitzen, dass ihnen
die Darstellung eines linearen Gleichungssystems durch Matrix und Vektoren keine Schwie-
rigkeiten mehr bereitet.
Die einzufordernde Interpretation der i-ten Matrixspalte als Übergangswahrscheinlichkeiten
einer Seite Wi zu einer Seite Wj sollen sowohl das Verständnis des Übergangsgraphen stärken
als auch die Begriffe stochastische Matrix und stochastischer Vektor (s. Aufgabe c)) vorberei-
ten.
Die Verteilung der Internetuser nach den ersten drei Klicks mit Hilfe des Startvektors
auszudrücken, wird die Schüler zu folgenden Ergebnissen führen:
,
,
.
Hierbei sollte die Lehrkraft darauf achten, dass die Schüler mittels des auch für die Matri-
zenmultiplikation gültigen Assoziativgesetzes begründen, weshalb die jeweils vorletzte Glei-
chung gültig ist. Insgesamt sollen sie zu folgender allgemeinen Darstellung geführt werden:
.

20
An dieser Stelle bietet sich ein kurzer Exkurs zur Potenzmethode an, die dem algorithmi-
schen Iterationsverfahren gegenübergestellt werden sollte. Hierbei lohnt ein Blick auf den
Rechenaufwand und die zu tätigenden Rechenoperationen.
Anschließend dient die Aufgabe c) der Vorbereitung der Begriffe stochastischer Vektor bzw.
stochastische Matrix. Die Beziehung für alle Spaltenvektoren einer Matrix
lässt sich auch intuitiv leicht begründen: Die Gesamtwahrscheinlichkeit, einen
der zur Verfügung stehenden Links anzuklicken, beträgt 1. Ähnlich ist die Begründung der
Stochastizität der Vektoren . Mittels der Beziehung kann man schließlich all-
gemein begründen, dass das Produkt stochastischer Matrizen bzw. das Produkt aus einer sto-
chastischen Matrix und einem stochastischen Vektor wieder stochastisch sind.

Nach einem längeren leicht theoretischen Abschnitt sollen die Schüler ihrer formalen
Kenntnisse wieder anwenden und die Stabilisierung der relativen Häufigkeiten bei wachsen-
der Anzahl der Klicks nachweisen. Da in der Sekundarstufe I die Kinder den Umgang mit
Matrizen nicht kennen, müssen sie diese Aufgabe wieder über eine Tabellenkalkulation lösen,
wogegen die Schüler der Oberstufe dazu angehalten sind, ihre Lösung in Hinblick auf die
Potenzmethode mit Hilfe eines CAS zu ermitteln. In beiden Fällen werden sie zu folgenden
Ergebnissen kommen: Bei einer Berechnungsgenauigkeit von zwei Stellen nach dem Komma
stabilisieren die Werte sich ab , bei fünf Stellen nach dem Komma ab . Die ent-
sprechenden Grenzmatrizen haben folgende Gestalt:

mit ,

mit .

Es ist sinnvoll, die Schüler den Zusammenhang zwischen der Berechnungsgenauigkeit und
der Anzahl der Iterationen formulieren zu lassen. Zugleich wird dadurch die Bedeutung des
Grenzwertbegriffs verdeutlicht.
Der Vergleich zwischen den Spaltenvektoren der Grenzmatrix und dem entsprechenden
stabilen Vektor ist auf jeden Fall inhaltlich zu begründen: Mit wachsendem n stabilisieren
sich die relativen Anteile der User, die sich auf einer der Internetseiten aufhalten, egal wie die
Anfangsverteilung aussieht. Anders formuliert: Ein User wird, wenn er „lange genug“ Internet
surft, mit einer gewissen Wahrscheinlichkeit zu einer Webseite Wi gelangen, egal von wel-
cher Webseite aus er startet.

21
Daran anschließend sollte sich eine Diskussion über die Platzierungsmöglichkeit der einzel-
nen Internetseiten auf einer Rangliste anschließen und zu diesem Ergebnis führen: Die lang-
fristigen relativen Anteile geben Auskunft über die Bedeutsamkeit einer Webseite, da eine
wichtige Internetseite auf lange Sicht mehr User anzieht als eine unbedeutende. Daher können
die Einträge aus den Spalten der Grenzmatrix dazu verwendet werden, eine Liste aufzustellen,
auf der die Webseiten mittels der Wahrscheinlichkeit, mit der sie langfristig besucht werden,
nach Bedeutsamkeit zu ordnen.

Das erarbeitete Verfahren soll nun für drei weitere Verfahren angewendet werden. Im Fol-
genden werden die Ergebnisse angegeben:

1. , ,

2. ,

Die Nullzeile lässt sich dadurch erklären, dass es keinen Link gibt, der auf die Seite W5
verweist, so dass diese Seite nie besucht wird.

3. Die zugehörige Übergangsmatrix hat die Gestalt . Sollte den Schülern

nicht schon vorher die Besonderheit der Matrix auffallen, so werden sie bei der Iteration
bzw. der Potenzmethode folgende Beziehung feststellen:
.
Dieses Ergebnis soll die Schüler beabsichtigt verwirren und auf zur nächsten Sequenz
überleiten.

Voraussetzungen für die Konvergenz der Übergangsmatrix


Das Verhalten der letzten Übergangsmatrix beim Potenzieren wird die Schüler zunächst be-
fremden und sollte mit den Schülern im Unterrichtsgespräch begründet werden.

22
Eine genaue Betrachtung der richtig aufgestellten Übergangsmatrix ist an dieser Stelle ange-
bracht und von den Schülern die Frage zu beantworten, welche Besonderheit der Übergangs-
graph und damit die zugehörige -matrix aufweisen: Die dritte Spalte weist nur Nullen auf, was
durch die fehlenden Outlinks bei der Internetseite W3 begründet werden kann. Es handelt sich
also um eine „Internetsackgasse“, einem dangling node. Es lohnt sich, die Schüler darüber
nachdenken zu lassen, was alles als dangling node aufgefasst wird. Die Tatsache, dass bereits
so oft verwendete Dateien wie eine .pdf-Datei oder verschiedene Film- (.mkv, .mpg4) bzw.
Musikdateien (.mp3, .wmv) solche „Sackgassen“ erzeugen, führen zu der Erkenntnis, dass es
unzählige solcher Problemstellen im Netz gibt.
Es ist wichtig, die Stochastizität der Matrix U in diesem Zusammenhang anzusprechen, falls
die Schüler dieses Kriterium nicht selbst zur Sprache bringen. Als Konsequenz steht die Frage
im Raum, welche Eigenschaften eine Übergangsmatrix erfüllen muss, damit eine Grenzmatrix
existiert. Hier kann folgender Grenzwertsatz ohne Beweisführung den Schülern präsentiert
werden:
Wenn eine Übergangsmatrix stochastisch ist und für irgendein nur positive
Einträge hat, dann streben die Matrixpotenzen für zu einer stochastischen
Grenzmatrix G mit identischen Spalten.
Die erste Voraussetzung ist für das dritte Beispiel von Arbeitsblatt 2 verletzt, so dass keine
Grenzmatrix existieren kann. Im weiteren Unterrichtsverlauf muss daher über eine Lösungs-
möglichkeit nachgedacht werden, die durch folgende Frage angeregt werden kann: Was
macht ihr, wenn ihr beim Surfen in eine solche „Internetsackgasse“ wie die Internetseite W3
geratet? Die regulären Antworten werden sich darauf beziehen, dass man im Browser eine
Seite zurückgeht bzw. eine neue Internetadresse eingibt.
Ziel des weiteren Verlaufs soll es sein, mit den Schülern eine stochastische Matrix S zu bil-
den und darüber hinaus auch die Möglichkeit einzubeziehen, zu jedem Zeitpunkt eine neue
Internetadresse einzugeben, wodurch man letztlich zu der Beziehung gelangt, die im fachwis-
senschaftlichen Teil beschrieben wurde: .
Es ist wichtig, mit den Schülern die Eigenschaften der Matrix G festzuhalten: Ihre Positivität
und Stochastizität, deren Begründung von den Schülern ebenfalls einzufordern ist, liefern die
Voraussetzungen für den obigen Grenzwertsatz, so dass die Existenz einer eindeutigen Lö-
sung gesichert ist.
Das Arbeitsblatt 3 hat dann zur Aufgabe, den Schülern die Abhängigkeit der Konvergenzra-
te vom Parameter α zu verdeutlichen. Die zu erzielenden Ergebnisse sind dieselben, die im
fachwissenschaftlichen Teil dieser Arbeit genannt wurden.

23
Es sei darauf hingewiesen, dass der genannte Grenzwertsatz und die daraus resultierenden
Betrachtungen nicht geeignet sind für die Mittelstufe. Sehr wohl aber kann mit Mittelstufen-
schülern ein wesentliches Kriterium für den Erhalt einer stabilen Verteilung erarbeitet werden,
nämlich dass der Übergangsgraph keine dangling nodes enthalten darf.
Nachfolgend werden die Ergebnisse aufgeführt, die die Schüler bei der Bearbeitung von Ar-
beitsblatt 3 erhalten sollten:
a)

b) Maple liefert folgende Ergebnisse:


Iterationen
Parameter α Grenzverteilung (transponierter Vektor)
bis Stabilität
6
8
11
16
18
25
35
55
111
244

24
c)

Iterationen bis Stabilität


300
250
200
150 Iterationen bis
Stabilität
100
50
0
0 0,2 0,4 0,6 0,8 1

25
Arbeitsblatt 1
(Einstieg)

Deutschlands drei größte Mobilfunkanbieter sind Vodafone, T-Mobile und E-Plus. Nehmen
wir an, diese sind die einzigen Anbieter in Deutschland und schließen mit ihren Kunden nur
Jahresverträge ab. Der Einfachheit halber sollen die Verträge stets ein Kalenderjahr gelten
und ein Betreiberwechsel somit nur zu
Jahresende bzw. -beginn möglich sein.
Die Kunden bleiben dann zu einem
bestimmten Prozentsatz bei ihrem
momentanen Anbieter bzw. wechseln
zu einem anderen. Die nebenstehende
Abbildung gibt an, wie die Prozentsät-
ze z.B. aussehen könnten.

Stell dir vor, die Prozentsätze aus der Abbildung bleiben unverändert.
a) Wie viele Kunden hat jedes Unternehmen nach einem Jahr und zwei Jahren, wenn zu Be-
ginn alle der Kunden haben?
b) Berechne mit Hilfe eines Programms für Tabellenkalkulation die Kundenverteilung nach 5,
10 und 20 Jahren! Was stellst du fest?
c) Sei nun die Ausgangsverteilung der Kunden anders: Bei Vodafone seien 40% der Kunden,
bei T-Mobile 35% und bei E-Plus 25%.
Ermittle erneut die Kundenverteilung nach 5, 10 und 20 Jahren! Vergleiche deine Ergeb-
nisse mit deinen Resultaten aus Aufgabe 1b) und stelle eine Vermutung auf!

26
Arbeitsblatt 2
(page ranking)
Laut der Internetseite www.worldwidewebsize.com beträgt die Zahl der Webseiten, die von
den Suchmaschinen Google, Yahoo! und Bing registriert worden sind, zurzeit 7,92 Milliarden
Seiten (Stand: 20. Juni 2012).
Wenn wir heute bei Google Suchbegriffe wie „EM 2012“ oder „Fiskalpakt“ eingeben, ist das
Unternehmen in der Lage herauszufiltern, welche dieser unzähligen Seiten relevant für unsere
Suchanfrage sind, und darüber hinaus ihre Wichtigkeit in Form einer Rangliste anzugeben.

Schau dir zunächst folgenden Übergangsgraphen eines Mini-Webs von vier Internetseiten an:

Nimm an, dass alle Links auf einer Webseite mit derselben Wahrscheinlichkeit angeklickt
werden. Für die Webseite A bedeutet dies demnach, dass jeder Link mit einer Wahrschein-
lichkeit von angeklickt wird, da von dieser Seite drei Links ausgehen.

Die Menge der User verteile sich zu Beginn mit den relativen Anteilen A0, B0, C0 und D0 auf
die vier Webseiten. Zur Vereinfachung nehmen wir an, dass alle gleichzeitig einen Link der
Seite anklicken, auf der sie sich gerade befinden.
a) Sek. I+II: Stelle ein lineares Gleichungssystem auf, das die Verteilung nach n Klicks be-
schreibt.
b) Sek. II: – Drücke das gewonnene lineare Gleichungssystem durch eine Matrix U und
Vektoren aus. Erkläre, was für Wahrscheinlichkeiten in jeder Spalte der Mat-
rix U stehen.
– Stelle die Verteilung der User nach 1, 2 und 3 Klicks mit Hilfe der Übergangs-
matrix und dem Startvektor der Ausgangsverteilung (A0, B0, C0, D0) dar.
Verallgemeinere die Beziehung für n Klicks.
c) Sek. II: – Die Matrix U hat eine besondere Eigenschaft: Addiere jeweils die Spaltenein-
träge. Welche Eigenschaft hat eine solche stochastische Matrix U?
– Begründe, weshalb auch die Vektoren stochastisch sind!

27
Eine Internetseite ist umso wichtiger, je mehr User sie besuchen. Um eine Rangfolge der Be-
sucherzahlen und damit der Bedeutsamkeit der Webseiten anzugeben, muss untersucht wer-
den, ob sich die Besucherzahlen mit der Zeit bei festen Werten einpendeln.
d) Sek. I + II: – Nimm an, dass sich zu Beginn auf jeder Webseite gleich viele User befinden.
Untersuche mit Hilfe eines Tabellenkalkulationsprogramms bzw. eines
Computer-Algebra-Systems, ob sich die Besucherzahlen stabilisieren.
– Falls sich die Werte einpendeln, gib die stabile Verteilung (Grenzwertvertei-
lung) der Besucherzahlen an. Nach wie vielen Schritten sind diese Werte er-
reicht, wenn du auf zwei bzw. fünf Stellen nach dem Komma rundest?
Sek. II: – Vergleiche die Spalteneinträge der Matrix mit dem stabilen Vektor .
e) Sek. I+II: – Ermittle für folgende Übergangsgraphen das zugehörige lineare Gleichungs-
systems bzw. die Übergangsmatrix U.
– Ermittle die stabile Verteilung bzw. Grenzverteilung für jedes Mini-Web bei
einer Berechnungsgenauigkeit von fünf Nachkommastellen.
1.

2.

3.

28
Arbeitsblatt 3
(Einfluss des Parameters α)
Google gibt an, für den Parameter α den Wert zu verwenden. Die Suchergebnisse,
die das Unternehmen liefert, sind in der Regel auch zufriedenstellend. Doch warum verwen-
det Google gerade diesen Wert und nicht etwas oder ? Wir wollen der Frage
auf den Grund gehen, indem wir folgendes Mini-Web betrachten.

a) Stelle die allgemeine „Google-Matrix“ G für den Übergangsgraphen auf.


b) Berechne mit Hilfe eines CAS für die Werte sowie jeweils
die Grenzverteilung bei einer Genauigkeit von fünf Nachkommastellen. Gib ebenfalls an,
ab welchem die Grenzmatrix ausreichend approximiert ist.

c) Stelle den Zusammenhang zwischen dem Parameter α und der Anzahl der Iterationen bis
zur Stabilität graphisch dar.
Stelle eine Vermutung darüber an, warum sich Google für den Wert entschieden
hat.

29

Das könnte Ihnen auch gefallen