15.06.2010 – Kategorie: IT, eCommerce

Google’s neuer Suchindex: Caffeine

Google stellt sein neues Web-Indexierungssystem Caffeine vor. Caffeine soll frische Ergebnisse für Websuchen liefern und über 50 Prozent aktueller als der letzte Index sein.

Ob es sich um Nachrichten handelt, einen Blog oder einen Forumsbeitrag: Mit Caffeine sollen sich Links auf relevante Inhalte bereits viel früher nach der Veröffentlichung finden lassen, als es je zuvor möglich war.

Hier einige Hintergrundinformationen: Wer mit Google sucht, durchsucht nicht live das eigentliche Internet. Stattdessen wird in Google’s Webindex gesucht, wie in einem Verzeichnis in einem Buch, mit dem man über Stichworte die gewünschten Informationen findet.

Warum hat Google ein neues Indexierungssystem entwickelt? Dafür gibt es zwei Gründe: Zum einen vermehren sich Inhalte im Web laufend. Nicht nur der Umfang von Inhalten und die Anzahl der Einträge nehmen zu. Durch Videos, Bilder, Nachrichten und Aktualisierungen in Echtzeit wird eine durchschnittliche Webseite auch inhaltsreicher und komplexer. Zum anderen sind die Ansprüche der Nutzer an die Suche höher als früher. Suchende möchten die neuesten relevanten Inhalte finden. Und Autoren erwarten, sofort mit der Veröffentlichung ihrer Werke im Internet auffindbar zu sein.

Um mit der Entwicklung des Web Schritt halten und die steigenden Erwartungen der Nutzer erfüllen zu können, hat Google Caffeine entwickelt.

Der alte Index umfasste mehrere Ebenen, von denen manche häufiger aktualisiert wurden als andere. Ein großer Teil des gesamten Index wurde lediglich alle paar Wochen aktualisiert. Um eine einzelne Ebene des alten Index zu aktualisieren, musste das gesamte Web analysiert werden. Dies führte zu einer deutlichen Verzögerung zwischen dem Zeitpunkt, an dem eine Seite gefunden wurde und dem Zeitpunkt, an dem sie zur Verfügung stand.

Mit Caffeine lässt sich das Web in kleinen “Portionen“ analysieren und der Suchindex kontinuierlich aktualisieren – und das weltweit. Caffeine ermöglicht das Indexieren von Webseiten in einem enormen Umfang. Tatsächlich verarbeitet Caffeine in jeder Sekunde Hunderttausende von Webseiten gleichzeitig. Wenn es sich hier um einen Stapel Papier handeln würde, würde dieser jede Sekunde fünf Kilometer höher werden. Caffeine belegt fast 100 Millionen Gigabyte Speicherplatz in einer Datenbank und fügt neue Informationen mit einer Rate von Hunderttausenden von Gigabyte pro Tag hinzu. Man bräuchtet etwa 625.000 iPods mit dem größten Speicherplatz, um diese Menge an Informationen zu speichern. Aneinandergelegt würden diese insgesamt eine Länge von über 64 Kilometern erreichen.

(Autor: Carrie Grimes, Software Engineer Google)

 


Teilen Sie die Meldung „Google’s neuer Suchindex: Caffeine“ mit Ihren Kontakten:


Scroll to Top