Der PageRank Algorithmus
Mythos PageRank. Für jeden Webseitenbetreiber und vor allem für SEO´s mit die wichtigste Zahl im Web. Kurz gesagt ist der Google PageRank eine Bewertung für Webseiten die von 0 bis zum magischen Höchstwert 10 reicht. Je höher der Wert umso besser, aber woher kommt dieser Wert bzw. wie wird dieser von Google berechnet? Der PageRank-Algorithmus, berühmt geworden durch den Suchmaschinen Marktführer Google, hat seinen Ursprung in der Soziometrie, also der empirischen Sozialforschung, die die Beziehungen zwischen Mitgliedern einer Gesellschaft mit grafischen verbindungen zu erfassen versucht. Das Verfahren wurde 1998 von den Google Gründern Larry Page und Sergey Brin während ihres Studiums an der Standford Universaty aufgegriffen und für die Bewertung von Internetseiten modifiziert. Der anschließend zum Patent angemeldete PageRank Algoritmus bildete die Grundlage für die Suchmaschine Google und den darauf aufbauenden Erfolg.
Mathematisches Grundprinzip des PageRanks
Der PageRank versieht jede Webseite mit einer Gewichtung/Bewertung, den PageRank, die umso höher ausfällt, je mehr Seiten auf diese Seite verweisen. Das Gewicht PRi einer Seite (i) wird also aus den Gewichten PRj der auf i verlinkenden Seiten j berechnet. Wird von j auf insgesamt Cj verschiedene Seiten verlinkt, so wird das Gewicht PRj anteilig auf diese verteilt. Um den PageRank einer Seite zu berechnen, muss folgendes lineares Gleichungssystem gelöst werden:
M * PR=(1-d)
Der Wert d (0<d<1) ist dabei ein Dämpfungsfaktor, damit die Gewichtung nicht auf Seiten abfällt, die auf keine anderen Seiten verweisen. Beträgt d=1, wird der PageRank komplett weitergeleitet, bei kleineren d-Werten erfolgt die Dämpfung. PR ist ein N-dimensionaler Vektor und M ist eine NxN-Matrix, wobei N die Anzahl der insgesamt betrachteten Seiten ist. Daher ist die i-te Kommponente des Vektors PR (also PRi), der PageRank der i-ten Seite. Der weitere Aufbau der matrix M und der einzelnen Berechnungsschritte kann im Internet unter den veröffentlichten Seiten der Universität Stanford eingesehen werden.
Der ursprünglich zum Patent angemeldete Algorithmus und das aktuelle Verfahren von Google zur Bewertung des PageRank sind nicht mehr identisch. Die aktuelle Technologie hat ihren Ursprung aber in der eben vorgestellten Formel. Nach und nach wurden in vielen Intervallen Anpassungen vorgenommen, um zum Beispiel künstlich erzeugte oder „eingekaufte“ Verweise zu eliminieren.
Dein Kommentar
An Diskussion beteiligen?Hinterlasse uns Deinen Kommentar!