Woche12: page rank Algorithmus

Post Reply
iamoos
Posts: 9
Joined: 27.02.2019 15:17

Woche12: page rank Algorithmus

Post by iamoos » 13.05.2019 16:20

Folie 38/39:
Warum wird Knoten 3 höher gewichtet als Knoten 2?
Es heisst ja, PR1=PR2 und PR3=PR1 (also indirekt auch wieder = PR2), also müssten Knoten 1 und 3 doch beide gleich gewichtet sein wie Knoten 2?
Bei Knoten 4 und 6 steht jeweils = 1/3 PR3. laut dem Python script (Folie 29) sind sie mit 0.23 auch gleich gewichtet, was logisch erscheint.
Also warum gibt es dann für Knoten 1, 2, 3 unterschiedliche Werte?
You do not have the required permissions to view the files attached to this post.

zabuergl
Posts: 74
Joined: 08.09.2009 17:41

Re: Woche12: page rank Algorithmus

Post by zabuergl » 26.05.2019 08:04

Dieses erste, vereinfachte Surfmodell berechnet die Wahrscheinlichkeit, dass man im Knoten i landet und bezeichnet diese mit PR_i, setzt sie also gleich dem Page-Rank des Knoten i. Dann hat man folgendes:

1. Die Wahrscheinlichkeit, dass man im Knoten 1 landet ist gleich der Wahrscheinlichkeit, dass man im Knoten 2 landet. Denn nur wenn man in 2 landet, landet man einen Schritt später in 1. Es gilt also
PR_1 = PR_2
2. Die Wahrscheinlichkeit, dass man in 2 landet setzt sich (in gleichen Teilen) zusammen aus der Wahrscheinlichkeit, dass man in 3, 4, oder 5 landet. Sie ist also gleich der Summe der Wahrscheinlichkeiten, dass man in 3, 4 oder 5 landet und dann weiter nach 2 surft. Es gilt also
PR_2 = 1/3*PR_3 + PR_4 + PR_5
3. Die Wahrscheinlichkeit, dass man in 3 landet ist gleich der W'keit, dass man in 1 landet, also gilt:
PR_3 = PR_1
4. usw.

Wenn man jetzt das entstandene Gleichungssystem (eigentlich ein Eigenwertproblem) löst, z.B. mit Python, dann erhält man
Page-Rank_Simple_Surf_Model_01.png
Also gilt, bis auf Rundungsfehler PR_1 = PR_2 = PR_3 = PR_4 = PR_5 = PR_6 = 0 und erst wenn man normiert, kommen die gezeigten W'keiten vor. Korrekterweise müsste man hier aber angeben, dass die NULL-Lösung rauskommt. Das vereinfachte Surfmodell ist also in diesem Fall völlig nutzlos!
You do not have the required permissions to view the files attached to this post.

Post Reply