Google liefert in seiner Suchmaschine nur Links auf andere Internetseiten? Das war einmal. Google liefert inzwischen auch Antworten. Wer zum Beispiel „Wetter Hamburg” eingibt, bekommt von Google direkt einen aktuellen Wetterbericht geliefert. Auch Aktienkurse, Sportergebnisse, Flugdaten oder das Kinoprogramm kommen inzwischen direkt von Google – was die Klicks auf die Suchergebnisse der anderen Anbieter einbrechen lässt. Geht es nach Google, sind diese einfachen Datenbankabfragen aber erst der Anfang. „Wir versuchen uns von Antworten, die auf Links basieren, zu Antworten zu bewegen, die auf Algorithmen basieren, so dass wir die richtige Antwort geben können. Wir haben nun genügend künstliche Intelligenz und genügend Größe, um die richtige Antwort zu berechnen”, sagte der Google-Verwaltungsratschef Eric Schmidt jüngst auf einer Internet-Konferenz. Je größer die Datenbestände in den Google-Rechenzentren werden, desto mehr Antworten lassen sich mit einer intelligenten Verknüpfung der Daten errechnen. Und wenn die eigenen Informationen mal nicht reichen, kauft Google sie eben. Wie die Reiseseite ITA für 700 Millionen Dollar, die in ihrer Datenbank fast alle Flugverbindungen gesammelt hat. Dank dieser Daten zeigt Google auf die Suchanfrage „Flüge von Frankfurt nach Berlin” nun einen kompletten Flugplan und die beiden anbietenden Fluggesellschaften Lufthansa und Air Berlin. Der Schritt zu Preisvergleichen ist nicht mehr groß und von dort ist der Weg zur direkten Buchung ebenfalls nicht weit.
Doch selbst Google kann nicht alle fehlenden Informationen einfach kaufen. Bevor aus der Suchmaschine eine Antwortmaschine werden kann, müssen die Informationen, die Google auf den Internetseiten findet, dort besser ausgezeichnet werden. Dem Wort „Casablanca” sollte zum Beispiel im Hintergrund die Information mitgegeben werden, ob es sich um die Stadt oder den Film handelt. Das sollen die Betreiber der Seiten nun selber tun. Dafür hat Google gemeinsam mit den Konkurrenten Microsoft und Yahoo die Initiative „Schema.org” ins Leben gerufen. Darin haben die Suchmaschinen mehr als 100 Kategorien definiert, die Webseiten-Betreiber künftig mitliefern sollen, zum Beispiel ob es sich um eine Person, eine Organisation, einen Ort oder ein Ereignis handelt. Das wäre ein Schritt in das semantische Internet, das Inhalte nicht nur erkennt, sondern auch versteht. Dann wäre Google in der Lage, nicht nur Suchbegriffe zu finden, sondern auch Fragen zu beantworten – ähnlich wie es der IBM-Supercomputer Watson in der amerikanischen Quizshow Jeopardy demonstriert hat. Diese „Suche ohne Links” eignet sich vor allem für die Smartphones, auf deren Bildschirmen kein Platz für lange Trefferlisten ist.
Online-Shops übermitteln solche Daten heute schon an die Suchmaschinen, damit ihre Produkte besser in den Suchtreffern auftauchen. Unter den Inhalteanbietern ist der Vorstoß der Suchmaschinen aber weniger beliebt. Denn wenn die Suchmaschinen gleich die Antworten (und nicht nur Links) liefern, werden immer weniger Nutzer nach der Suche noch auf andere Internetseiten klicken, um die Originalquelle anzusehen. „Gerade für Journalismus-Seiten könnte Schema.org gefährlich werden, wenn die Suchmaschinen aus den maschinenlesbaren Daten Wissen generieren können, das nicht mehr vom Urheberrecht geschützt ist”, sagt Alexander Siebert vom Berliner Unternehmen Retresco das sich auf die semantische Aufbereitung großer Datenmengen spezialisiert hat. Aber wie so oft im Internet befinden sich die Medienunternehmen in einem Dilemma: Wen ein einzelnes Unternehmen mitmacht, verbessert es seine Situation, da es wahrscheinlich besser in der Suchergebnissen auftaucht und entsprechend mehr Besucher bekommt. Genau diese Reaktion erwartet Siebert: „Sobald die Verlage mitbekommen, dass man mit Schema.org oben im Google-Ranking landet, werden alle mitmachen”, lautet seine Prognose. Machen aber alle Unternehmen mit, bekommen die Suchmaschinen mehr Daten, um direkt die Antworten zu liefern. Also versuchen einige Medienunternehmen, ihre Konkurrenten zu überzeugen, dass keiner dabei mitmacht. Und der beste Weg dorthin führt nicht über Appelle, sondern über eine eigene Lösung. Die heißt rNews, wurde vom International Press Telecommunications Council (IPTC) entwickelt und wird aktuell von Medienunternehmen wie der New York Times, AP und Getty Images angepriesen. Das Prinzip ist ähnlich: Namen, Orten oder Zeiten werden in den Dokumenten festgelegt. „Potential können alle wichtigen Nachrichtenanbieter auf der Welt ihre Nachrichten mit Metadaten anreichern. Die Nachrichten werden somit nutzbar und können – als Teil von Semantischen Web-Applikationen – leicht mit anderen Daten verknüpft werden. In kurzer Zeit könnten Nachrichten Teil des semantischen Web werden mit der Besonderheit, extrem dynamische Daten zu haben, die täglich aktualisiert werden”, jubelte Ivan Herman, der im World Wide Web Consortium (W3C) für die Entwicklung des semantischen Web verantwortlich ist.
Allerdings laufen die aktuellen Strategien vieler Verlage in die andere Richtung. Sie planen Zahlschranken vor ihren Inhalten, um direkt Geld mit dem Verkauf verdienen zu können. Das wäre dann das genaue Gegenteil von der perfekten Aufbereitung für eine möglichst weitgehende Nutzung im Web.
_______________________________________________________________________________