Netzwirtschaft

Google aktualisiert Page Rank

Google hat seinen Page-Rank aktualisiert. Unter den Medienseiten hat die New York Times den höchsten Wert (9 von 10), gefolgt von der britischen Financial Times, Spiegel.de und Welt.de. Danach folgen FAZ.NET, FTD.de, Handelsblatt.com und Süddeutsche.de.

 

Die gut vernetzten deutschen Blogs schaffen einen Page Rank von 6. In Amerika schaffen Techcrunch und die Huffington Post einen Page Rank von 8. 

 

Der Page-Rank misst, wie viele andere Internetseiten Links auf diese Seite gesetzt haben und gilt als Indikator für die Bedeutung einer Seite. Allerdings trägt der Page Rank nur einen Teil zur Position einer Seite in der Suchtreffern bei Google bei.

Das erste Kriterium, nach dem Google die Seiten sortiert, ist die Reputation der Seite. Eine Suche nach “Gordon Brown” wird zum Beispiel einen Eintrag bei Wikipedia oder die Seite der Labour Party in Großbritannien als Seiten mit hoher Reputation ausweisen. Diese Reputation richtet sich vor allem nach dem ermittelten Page Rank. Aber daneben gibt es mehr als 200 weitere Kriterien, die Google Signale nennt. Dazu gehört, wie oft die Wörter Gordon und Brown auf der Seite vorkommen, ob die Wörter im Titel der Seite oder in der Internetadresse vorkommen, wie dicht sie beieinander stehen oder wann die Seite zuletzt aktualisiert wurde. “Diese Signale werden von uns unter dem Begriff ,Topicality’ zusammengefasst. Dabei geht es darum, welche Bedeutung der Suchbegriff auf der Seite einnimmt”, erklärt Matt Cutts von Google in der FAZ. Je höher die Kombination aus Reputation einer Seite und Bedeutung des Suchbegriffes auf der Seite ist, desto weiter oben wird die Seite auf der Trefferliste aufgeführt. ” 

Das kann manchmal einen Zielkonflikt bedeuten: Ein Artikel in der ,New York Times’, der ,Gordon Brown’ einmal enthält, hat sicher eine hohe Reputation, aber nur einen geringen Topicality-Wert. Umgekehrt hat eine Seite, in der ein unbekannter Gordon-Brown-Gegner ausführlich aufführt, dass er seine Frisur nicht mag, einen hohen Topicality-Wert, aber sicher nur eine sehr geringe Reputation. Was der Nutzer also wirklich will, sind hohe Werte bei beiden Kriterien, also zum Beispiel ein Wikipedia-Eintrag”, erklärt Cutts.

Die mehr als 200 Signale müssen dann noch gewichtet werden. Dazu nutzt Google sogenannte Classifier. “Ein Classifier, der zum Beispiel Page Rank und die Anzahl der Nennungen des Suchbegriffes auf der Seite je zur Hälfte gewichtet, könnte von einem Spammer sehr leicht ausgetrickst werden, indem er den Suchbegriff 5000 Mal auf seiner Seite nennt. Deshalb sind die Classifier komplizierter, um genau dieses Verhalten auszuschließen. Am Ende steht eine Signalnummer, die über die Reihenfolge auf der angezeigten Trefferseite entscheidet”, sagt Cutts.

Die Trefferlisten sehen aber nicht immer gleich aus. Zum Beispiel sei die “Bank of America” ein gutes Suchergebnis, wenn jemand in Amerika das Wort Bank eingibt. In England müsse die Suche natürlich englische Banken anzeigen, sonst sei das Ergebnis nichts wert.

“Das Suchergebnis kann sich auch innerhalb von Minuten ändern. Als die Bombenanschläge in Großbritannien passierten, mussten wir innerhalb weniger Minuten reagieren und mehr aktuelle Nachrichten und Blogeinträge unter den ersten zehn Suchtreffern einblenden, da die Nutzer natürlich in diesem Moment an aktuellen Informationen interessiert waren. Dabei hilft uns ein Instrument namens Google Trends. Es misst, wie häufig ein Suchbegriff in aller Welt eingegeben wird. Sobald die Suchwörter schnell ansteigen, reagiert das System darauf und streut mehr aktuelle Suchtreffer ein”, sagt Cutts.

Parallel schicke Google die Anfrage zu einem Rechtschreibserver, der möglicherweise Vorschläge für eine andere Schreibweise macht. “Außerdem müssen wir auf semantische Verwandtschaften achten. Eine Seite könnte zum Beispiel das Wort Premierminister enthalten, aber nicht Gordon Brown. Wir müssen sicherstellen, dass damit ein und dieselbe Person gemeint ist”, sagt Cutts.

Wichtig für Google sei auch die richtige Mischung der Treffer. “Wenn jemand das Suchwort ,iPhone’ eingibt, könnten unter den ersten zwanzig Treffern nur Apple-Seiten vorkommen, wenn wir nur das Kriterium ,Topicality’ berücksichtigen. Wir begrenzen aber die Zahl der Seiten von einer Internetadresse, damit der Nutzer eine gute Mischung bekommt. Das kann bedeuten: nur zwei offizielle Apple-Seiten, dann zwei relevante Besprechungen des Handys in Blogs, Nachrichten zum iPhone, Produkttests und noch die Seite eines Händlers, der das iPhone verkauft”, sagt Cutts.

Links:

 

P.S. Die neue Suchmaschine Cuil.com war mir nach einem ersten Test keinen eigenen Beitrag wert. Gute Leute, sehr gute PR, aber die Suchergebnisse sind miserabel und ein “Google-Killer” sieht anders aus. Cuil erinnert mich an ein Gespräch mit Peter Norvig, Googles Forschungsdirektor. “Das semantische Web ist für viele Dinge gar nicht zu gebrauchen“, sagte Norvig. Ähnlich pessimistisch ist Norvig gegenüber dem Versuch des amerikanischen Start-ups Powerset, bessere Suchmaschinen mit Hilfe der „Natural Language“ bauen wollen. „Es gibt immer neue Suchmaschinen, deren Technik in der Presse hochgejubelt wird. Sie können mir glauben: Wir arbeiten auch an all diesen Techniken und werden sie einsetzen, wenn sie unser Produkt besser machen“, sagte Norvig.

UPDATE: Manager-Magazin.de legt Wert darauf, ebenfalls einen Page Rank von 7 zu haben.

Die mobile Version verlassen