Googles “Caffeine” Technologie-Update abgeschlossen
10 Monaten ist es her, als wir erstmals über “Caffeine” – Googles neue Suchtechnologie oder besser gesagt “Architektur” berichteten. Caffeine soll die Suchmaschine für die gestiegenen Anforderungen des Social Webs in Sachen Aktualität der Ergebnisse fit machen.
Gestern Abend gab Matt Cutts (das Gesicht der “Search Quality Group” bei Google) auf der SMX Advanced Konferenz, die derzeit in Seattle stattfindet, bekannt, dass die neue Architektur nun auf allen Google Servern zum Einsatz kommt.
Mit Caffeine werden gecrawlte Seiten innerhalb von wenigen Sekunden in den Index aufgenommen. Früher wurde erst eine massive Anzahl von Seiten gecrawlt und zu einem späteren Zeitpunkt in den Index bzw. in die Datencenter übertragen (dieses Prozedere dauerte Minuten bis Stunden). Google nutzte früher verschiedene Ebenen in denen – je nach Relevanz – Teile des Webs schneller bzw. langsamer durchforstet wurden. Für die Indizierung einer frisch gecrawlten „Ebene“ musste das gesamte Web analysiert werden. Aktuelle Dokumente landeten zeitverzögert im Index.
Nun wird der Index kontinuierlicher aktualisiert. Ebenen existieren nicht mehr. Wird eine Seite gecrawlt, landet diese neue Version des Dokuments fast in Echtzeit im Index.

Kurz zusammengefasst: Die neue Infrastruktur versetzt Google in die Lage wesentlich mehr Dokumente in deutlich kürzerer Zeit in den Index zu übernehmen.
Peter Wetzlmaier, am 09.06.10