Da alle Aufgaben aufeinander aufbauen, stelle ich sie zusammen in einer Frage. Ich hoffe, ihr kennt euch mit dem PageRank aus und könnt mich schlauer machen.
Aufgabenstellung:
Aufgabe 1)
Erstelle die PageRank-Gleichungen für folgendes Web mit den Seiten A, B und C wobei A zu B und C, B zu C, C zu A verlinkt. Der Dämpfungsfaktor soll 0,5 betragen.
Verwende dabei einmal Formel (I) und einmal Formel (II).
(I) PR(Z) = (1 – d) + d * Summe aus (PR(R) / abgehende Links von R)
(II) PR(Z) = (1 – d) / 3 + d * Summe aus (PR(R) / abgehende Links von R)
R = jede Seite, die auf Z verlinkt
Aufgabe 2)
Führe alle Schritte wie in Aufgabe 1 durch. Der Dämpfungsfaktor soll nun 0,75 betragen.
Aufgabe 3)
Löse die so entstandenen Gleichungssysteme. Welche PageRank-Werte ergeben sich?
Aufgabe 4)
Führe mit dem Jacobi-Iterationsverfahren für Gleichungssystem (a) Iterationen durch. Wann konvergieren die Werte bis auf 8 Nachkommastellen genau? Der Startwert soll 1 betragen.
Lösungsansatz Aufgabe 1
(a) Gleichungen mit (I):
PR(A) = (1 – 1/2) + 1/2 * PR(C) / 1 = 1/2 + 1/2 * PR(C)
PR(B) = (1 – 1/2) + 1/2 * PR(A) / 2 = 1/2 + 1/4 * PR(A)
PR(C) = (1 – 1/2) + 1/2 * (PR(A) / 2 + PR(B) / 1) = 1/2 + 1/4 * PR(A) + 1/2 * PR(B)
(b) Gleichungen mit (II):
PR(A) = (1 – 0,5) / 3 + 1/2 * PR(C) / 1 = 1/6 + 1/2 * PR(C)
PR(B) = (1 – 0,5) / 3 + 1/2 * PR(A) / 2 = 1/6 + 1/4 * PR(A)
PR(C) = (1 – 0,5) / 3 + 1/2 * (PR(A) / 2 + PR(B)/1) = 1/6 + 1/4 * PR(A) + 1/2 * PR(B)
Lösungsansatz Aufgabe 2
(c) Gleichungen mit (I):
PR(A) = (1 – 3/4) + 3/4 * PR(C) / 1 = 1/4 + 3/4 * PR(C)
PR(B) = (1 – 3/4) + 3/4 * PR(A) / 2 = 1/4 + 3/8 * PR(A)
PR(C) = (1 – 3/4) + 3/4 * (PR(A) / 2 + PR(B) / 1) = 1/4 + 3/8 * PR(A) + 3/4 * PR(B)
(d) Gleichungen mit (II):
PR(A) = (1 – 3/4) / 3 + 3/4 * PR(C) / 1 = 1/12 + 3/4 * PR(C)
PR(B) = (1 – 3/4) / 3 + 3/4 * PR(A) / 2 = 1/12 + 3/8 * PR(A)
PR(C) = (1 – 3/4) / 3 + 3/4 * (PR(A) / 2 + PR(B) / 1) = 1/12 + 3/8 * PR(A) + 3/4 * PR(B)
Lösungsansatz Aufgabe 3
Lösung für (a)
(1) PR(A) = 1/2 + 1/2 * PR(C)
(2) PR(B) = 1/2 + 1/4 * PR(A)
(3) PR(C) = 1/2 + 1/4 * PR(A) + 1/2 * PR(B)
(1) umformen zu PR(C) (4):
(4) PR(A) = 1/2 + 1/2 * PR(C) | * 2
(4) 2 * PR(A) = 1 + PR(C) | – 1
(4) PR(C) = 2 * PR(A) – 1
PR(A) ermitteln -> (2) und (4) in (3) einsetzen:
2 * PR(A) – 1 = 1/2 + 1/4 * PR(A) + 1/2 * (1/2 + 1/4 · PR(A))
2 * PR(A) – 1 = 1/2 + 1/4 * PR(A) + 1/4 + 1/8 * PR(A)
2 * PR(A) – 1 = 3/4 + 3/8 * PR(A) | – 3/8 * PR(A)
13/8 * PR(A) – 1 = 3/4 | + 1
13/8 * PR(A) = 7/4 | : 13/8 bzw. * 8/13
PR(A) = 14/13 bzw. 1,07692307
PR(B) ermitteln -> Wert für PR(A) in (2) einsetzen:
PR(B) = 1/2 + 1/4 * 14/13
PR(B) = 1/2 + 7/26
PR(B) = 10/13 bzw. 0,76923077
PR(C) ermitteln -> Wert für PR(A) in (4) einsetzen:
PR(C) = 2 * 14/13 – 1
PR(C) = 28/13 – 13/13
PR(C) = 15/13 bzw. 1,15384615
Bis hierhin hat alles funktioniert. Die im Folgenden errechneten Werte sollten exakt 1/3 von den Werten bei (a) betragen, also z.B. PR(A) = 14/39, PR(B) = 10/13 und PR(C) = 15/39.
Lösung für (b):
(1) PR(A) = 1/6 + 1/2 * PR(C)
(2) PR(B) = 1/6 + 1/4 * PR(A)
(3) PR(C) = 1/6 + 1/4 * PR(A) + 1/2 * PR(B)
(1) umformen zu PR(C) (4):
(4) PR(A) = 1/6 + 1/2 * PR(C) | * 2
(4) 2 * PR(A) = 1/3 + PR(C) | – 1/3
(4) PR(C) = 2 * PR(A) – 1/3
PR(A) ermitteln -> (2) und (4) in (3) einsetzen:
2 * PR(A) – 1/3 = 1/6 + 1/4 * PR(A) + 1/2 * (1/6 + 1/4 * PR(A))
2 * PR(A) – 1/3 = 1/6 + 1/4 * PR(A) + 1/12 + 1/8 * PR(A)
2 * PR(A) – 1/3 = 1/4 + 3/8 * PR(A) | - 3/8 * PR(A)
13/8 * PR(A) – 1/3 = 1/4 | + 1/3
13/8 * PR(A) = 7/12 | : 13/8 bzw. *8/13
PR(A) = 14/39 bzw. ca 0,35897436
PR(B) ermitteln -> Wert für PR(A) in (2) einsetzen:
PR(B) = 1/6 + 1/4 * 14/39
PR(B) = 1/6 + 7/78
PR(B) = 10/39 bzw. ca. 0,25641026
PR(C) ermitteln -> Wert für PR(A) in (4) einsetzen:
PR(C) = 2 * 14/39 – 1/3
PR(C) = 28/39 – 1/3
PR(C) = 15/39 bzw. ca. 0,38461538
Das Ergebnis ist so, wie ich es vermutet habe! Die Werte betragen exakt 1/3 von den mit Formel (I) errechneten Werten und ergeben in Summe exakt 1.
Lösungsversuch für (c):
(1) PR(A) = 1/4 + 3/4 * PR(C)
(2) PR(B) = 1/4 + 3/8 * PR(A)
(3) PR(C) = 1/4 + 3/8 * PR(A) + 3/4 * PR(B)
(1) umformen zu PR(C) -> (4):
(4) PR(A) = 1/4 + 3/4 * PR(C) | : 3/4 bzw. * 4/3
(4) 4/3 * PR(A) = 1/3 + PR(C) | – 1/3
(4) PR(C) = 4/3 * PR(A) – 1/3
PR(A) ermitteln -> (2) und (4) in (3) einsetzen:
4/3 * PR(A) – 1/3 = 1/4 + 3/8 * PR(A) + 1/2 * (1/2 + 1/4 · PR(A))
4/3 * PR(A) – 1/3 = 1/4 + 3/8 * PR(A) + 1/4 + 1/8 · PR(A)
4/3 * PR(A) – 1/3 = 1/2 + 1/2 * PR(A) | - 1/2 * PR(A)
5/6 * PR(A) – 1/3 = 1/2 | - 1/3
5/6 * PR(A) = 1/6 | : 5/6 bzw. * 6/5
PR(A) = 1/5
PR(B) ermitteln -> Wert für PR(A) in (2) einsetzen:
PR(B) = 1/4 + 3/8 * 1/5
PR(B) = 1/4 + 3/40
PR(B) = 13/40
PR(C) ermitteln -> Wert für PR(A) in (4) einsetzen:
PR(C) = 4/3 * 1/5 – 1/3
PR(C) = 4/15 – 1/3
PR(C) = -1/15
Hat jemand eine Erklärung für diese Werte? Oder ist dieses Lösungsverfahren aus welchen Gründen auch immer hier ungeeignet? Wie kommen Werte im Minusbereich zustande, wenn der kleinstmögliche PageRank-Wert immer (1-d) beträgt?
Lösungsversuch für (d):
(1) PR(A) = 1/12 + 3/4 * PR(C)
(2) PR(B) = 1/12 + 3/8 * PR(A)
(3) PR(C) = 1/12 + 3/8 * PR(A) + 3/4 * PR(B)
(1) umformen zu PR(C) -> (4):
(4) PR(A) = 1/12 + 3/4 * PR(C) | : 3/4 bzw. * 4/3
(4) 4/3 * PR(A) = 1/3 + PR(C) | – 1/3
(4) PR(C) = 4/3 * PR(A) – 1/3
PR(A) ermitteln -> (2) und (4) in (3) einsetzen:
4/3 * PR(A) – 1/3 = 1/12 + 3/8 * PR(A) + 3/4 * (1/12 + 3/8 * PR(A))
4/3 * PR(A) – 1/3 = 1/12 + 3/8 * PR(A) + 1/16 + 9/32 * PR(A))
4/3 * PR(A) – 1/3 = 7/48 + 21/32 * PR(A) | - 21/32 * PR(A)
65/96 * PR(A) = 7/48 | : 65/96 bzw. * 96/65
PR(A) = 14/65
PR(B) ermitteln -> Wert für PR(A) in (2) einsetzen:
PR(B) = 1/12 + 3/8 * 14/65
PR(B) = 1/4 + 21/260
PR(B) = 21/1040
PR(C) ermitteln -> Wert für PR(A) in (4) einsetzen:
PR(C) = 4/3 * 14/65 – 1/3
PR(C) = 56/195 – 1/3
PR(C) = -3/65
Hier hat sich meine Vermutung, dass die Werte von (c) exakt 1/3 der Werte von (d) betragen, nicht bestätigt.
Hat jemand eine Erklärung für diese Werte? Hier stellen sich mir die gleichen Fragen wie bei der Lösung zu (c).
Wie sind diese Werte zu verstehen?
Lösungsansatz Aufgabe 4 erfolgt im 1. Kommentar.