Sie sind auf Seite 1von 17

Googles page-ranking-Verfahren

Probleme mit der Hyperlinkmatrix


• Internetseiten-Cluster
• dangling nodes
• spontane URL-Eingabe
Internetseiten-Cluster (1)
• Beispiel:

• nicht durch Klicken möglich


• zahlreiche solche Strukturen im WWW
→ nicht stark zusammenhängender Webgraph
Internetseiten-Cluster (2)

• Hyperlinkmatrix:

• Wo ist das Problem?



 2 Fixvektoren 
 ist invariant unter H5: und
 H5 ist reduzibel ( Perron-Frobenius)
Lösung? Gibt‘s später…
dangling nodes (Problem)
• zahlreiche Webseiten ohne weiterführende
Hyperlinks
– z.B. .pdf-, .jpg-, .mkv-Dateien
• Sackgassen (sog. dangling nodes)

• Beispiel: W1 W3

W2 W4

 H substochastisch  Konvergenz
dangling nodes (Lösung)
• Internetsackgasse? Neue URL eingeben!
→ dangling-node-Matrix D

• H+D= + = =: S

 S ist stochastisch → Konvergenz


Spontane URL-Eingabe
Hyperlinkmatrix H: Surfen nur durch Klicken
→ keine spontane Eingabe von Webadressen
Matrix für spontane Eingabe:

Transformationsmatrix T
→ jede Webseite von überall aus erreichbar
→ „Heilmittel“ gegen eine reduzible Matrix !
Klicken vs. Adresseingabe
Standardsurfen: Klicken und spontane Eingabe

G = αS – (1 – α)T → „Google“-Matrix
α – Wahrscheinlichkeit, mit der ein Surfer sich
durchs Netz klickt
→ Google: α = 0,85 
Konvergenz der Google-Matrix
• Vom rekursivem Ansatz zur Potenzmethode
• Konvergenzbeweis (Banachscher Fixpunktsatz)
Vom rekursiven Ansatz zur Potenzmethode
• Einträge gmn der Google-Matrix G:
Übergangswahrscheinlichkeiten (Wn  Wm)
• rekursiver Ansatz nach Page und Brink:

Potenzmethode
• Fragen: 1. Existiert ?
2. Wenn ja, wie sieht aus?
 Antworten: 1. Ja.
2. Spalten von sind gesuchter Fixvektor
Potenzmethode (Beispiel)
Konvergenzbeweis (Banachscher Fixpunktsatz)
Parameter der Google-Matrix
• Intelligenter Surfer
• Einfluss von α
Intelligenter Surfer
• Hyperlinkmatrix H idealisiert
→ Reihenfolge und Linkbeschreibung für Surfer
maßgebend
• Bsp.: W1 W3

doppelt wahrscheinlich
W2 W4


Einfluss von α
Einfluss von α

• α steigt  Konvergenzgeschwindigkeit sinkt


• α sinkt  Rankingwert-Unterschiede undeutlicher
• Ranking bei kleinen Webs relativ stabil
α = 0,85 eine gute Wahl?

• Steigung bis α = 0,85 relativ flach


→ akzeptabler Rechenaufwand

Das könnte Ihnen auch gefallen