Netzwirtschaft

Google-PageRank: F.A.Z. und Süddeutsche legen zu

Google hat den PageRank abermals aktualisiert. Wie Sistrix schreibt, ist der PageRank vieler Seiten gestiegen. Unter den Medienseiten haben FAZ.NET und Sueddeutsche.de ihren Wert von 7 auf 8 erhöht; die Werte der anderen Seiten, die in der Grafik aufgeführt sind, sind gleich geblieben. Der Maximalwert beträgt 10.

Der PageRank misst die Bedeutung einer Seite im Internet anhang der Links, die von anderen, möglichst bedeutenden Seiten auf eine Seite gesetzt werden. Anhand dieses Kriteriums haben die Google-Gründer damals die Internetseiten sortiert. Inzwischen ist der RageRank nur eines von mehr als 200 Kriterien, mit denen Google die gefundenen Seiten im Internet sortiert. (-> Wie die Suchergebnisse von Google zustande kommen) Allerdings ist das Zustandekommen der Reihenfolge ein recht komplexer Prozesse geworden. Das erste Kriterium, nach dem Google die Seiten sortiert, ist die Reputation der Seite. Eine Suche nach “Gordon Brown” wird zum Beispiel einen Eintrag bei Wikipedia oder die Seite der Labour Party in Großbritannien als Seiten mit hoher Reputation ausweisen. Diese Reputation richtet sich vor allem nach dem ermittelten Page Rank. Aber daneben gibt es mehr als 200 weitere Kriterien, die Google Signale nennt. Dazu gehört, wie oft die Wörter Gordon und Brown auf der Seite vorkommen, ob die Wörter im Titel der Seite oder in der Internetadresse vorkommen, wie dicht sie beieinander stehen oder wann die Seite zuletzt aktualisiert wurde. “Diese Signale werden von uns unter dem Begriff ,Topicality’ zusammengefasst. Dabei geht es darum, welche Bedeutung der Suchbegriff auf der Seite einnimmt”, erklärt Matt Cutts von Google in der FAZ. Je höher die Kombination aus Reputation einer Seite und Bedeutung des Suchbegriffes auf der Seite ist, desto weiter oben wird die Seite auf der Trefferliste aufgeführt. “

Das kann manchmal einen Zielkonflikt bedeuten: Ein Artikel in der ,New York Times’, der ,Gordon Brown’ einmal enthält, hat sicher eine hohe Reputation, aber nur einen geringen Topicality-Wert. Umgekehrt hat eine Seite, in der ein unbekannter Gordon-Brown-Gegner ausführlich aufführt, dass er seine Frisur nicht mag, einen hohen Topicality-Wert, aber sicher nur eine sehr geringe Reputation. Was der Nutzer also wirklich will, sind hohe Werte bei beiden Kriterien, also zum Beispiel ein Wikipedia-Eintrag”, erklärt Cutts.

Die mehr als 200 Signale müssen dann noch gewichtet werden. Dazu nutzt Google sogenannte Classifier. “Ein Classifier, der zum Beispiel Page Rank und die Anzahl der Nennungen des Suchbegriffes auf der Seite je zur Hälfte gewichtet, könnte von einem Spammer sehr leicht ausgetrickst werden, indem er den Suchbegriff 5000 Mal auf seiner Seite nennt. Deshalb sind die Classifier komplizierter, um genau dieses Verhalten auszuschließen. Am Ende steht eine Signalnummer, die über die Reihenfolge auf der angezeigten Trefferseite entscheidet”, sagt Cutts.Die Trefferlisten sehen aber nicht immer gleich aus. Zum Beispiel sei die “Bank of America” ein gutes Suchergebnis, wenn jemand in Amerika das Wort Bank eingibt. In England müsse die Suche natürlich englische Banken anzeigen, sonst sei das Ergebnis nichts wert.

“Das Suchergebnis kann sich auch innerhalb von Minuten ändern. Als die Bombenanschläge in Großbritannien passierten, mussten wir innerhalb weniger Minuten reagieren und mehr aktuelle Nachrichten und Blogeinträge unter den ersten zehn Suchtreffern einblenden, da die Nutzer natürlich in diesem Moment an aktuellen Informationen interessiert waren. Dabei hilft uns ein Instrument namens Google Trends. Es misst, wie häufig ein Suchbegriff in aller Welt eingegeben wird. Sobald die Suchwörter schnell ansteigen, reagiert das System darauf und streut mehr aktuelle Suchtreffer ein”, sagt Cutts.

Links:

 

 

 

Die mobile Version verlassen