google Images Update – Wann und wie oft?
„Hilfe, google findet meine Bilder nicht!“ – „Warum sind meine Bilder nicht in der google-Bildersuche zu finden?“ – „Wie lange dauert es, bis Bilder in den google-Index gelangen?“
Solche Fragen tummeln sich zu tausenden in Foren und Blog, doch kaum jemand kennt eine befriedigende Antwort. In aller Regel heißt es: „Der googlebot-Images kommt nur sehr selten!“ und „Das dauert Monate. Hab Geduld!“
In diesem Beitrag möchte ich versuchen, dem „Phänomen google Bildersuche“ näher zu kommen. Eine meiner Seiten hat über 500 Bilder im Index, und es werden in regelmäßigen Abständen mehr. Da ich viele Besucher über die google Bildersuche erhalte, sehe ich mir häufig die Änderungen (oder eben auch nicht) in den SERPs (search engine result pages) an. Auf Grundlage dieser Beobachtungen habe ich eine These formuliert, wie die google Bildersuche funktioniert.
Fakten zur google Bildersuche
Die google-Bildersuche bietet Milliarden von Bildern an. Wie viel genau, läßt sich nicht ermitteln. Zum Testen habe ich nach dem Buchstaben „a“ gesucht. Ergebnis: 1.27 Millarden. Interessant: Suche nach „s“ liefert 1,29 Milliarden. Lustig: Suche nach „p“ – davon wußte ich noch nicht [Anm. für zukünftige Genarationen: hier liegt ein Bild von mir auf Pos.1 ). Allein im „westlichen Kulturkreis“ sind es demnach fast 1,3 Mrd. Bilder.
Wenn man auf eine Bildersuche-Ergebnisseite geht, werden eine Reihe von Thumbnails (Mini-Bilder) aufgelistet. Wenn man die Eigenschaften der Thumbs ansieht, bemerkt man, dass es sich um „Kopien“ handelt. Google hat zu jedem Bild ein Thumbnail berechnet und bereitgelegt. In aller Regel sind diese Thumbs so um die 3-4 Kilobyte groß.
Wird nun eines der Bilder in der Bildersuche angeklickt, öffnet sich in aller Regel ein Frameset. Auf dieser (google-) Seite werden oben das Thumb sowie einige Bildinfos und unten in einem eingebetteten Frame die Zielseite gezeigt. Dieser Frame ist in jedem Fall problematisch (google-Richtlinien, SEO-technisch, rechtlich, ästethisch etc). Wie man dieses Frameset umgehen kann, ist in den beiden folgenden Artikel dieses Blogs beschrieben: Google Bildersuche framebreaker und Fazit des Framebreaker-Tests.
Für das Herunterladen der Bilder ist nicht der „normale“ googlebot, sondern der googlebot-image/1.0 zuständig. Das weit verbreitete Gerücht, dass dieser nur sehr selten vorbeikommt, habe ich in diesem Artikel widerlegt – zumindest gilt das für alle Seiten, die ich beobachte. So hat er allein gestern 24 Bilder von meine Hauptseite heruntergeladen. Diesen Blog, dessen domain ich vor 6 Tagen registriert habe, hat er allerdings noch nicht besucht. Ich werde das beobachten…
Der googlebot-image Crawler ist auf Informationen vom „normalen“ googlebot angewiesen. Google weißt explizit darauf hin, dass Bilder nur gefunden werden, wenn sie in eine Website integriert sind von einer Webseite verlinkt sind [siehe hier, Punkt 6]. Der googlebot-image Crawler wird also erst aktiv, wenn er „irgendwie vom normalen googlebot informiert“ worden ist. Wie das gennau abläuft und ob es dabei Möglichkeiten der Optimierung gibt, werde ich demnächst genauer untersuchen.
Soweit die Fakten. Von google selber ist zur Bildersuche und den dahinter stehenden Mechanismen nicht „Offizielles“ zu erfahren. Anfragen dieser Art werden ignoriert (möglicherweise bin ich inzwischen als Spammer gebrandtmarkt und meine Post kommt gar nicht an). Im folgenden werden daher mehrere Thesen zur Funktionsweise von google-images vorgestellt, die nicht neu, aber auch nicht verifiziert sind.
Funktionsweise des Backends der google-Bildersuche
Ich gehe von folgendem Ablauf aus: Der „normale“ googlebot findet eine Seite und lädt sie herunter. Wenn er dabei auf (neue) Bilder (<img tag>) stößt, legt er eine Art „leere Image-Datei“ an. Diese Datei wird mit den gefundene „Daten“ gefüttert, die für den Algorythmus, der das spätere Ranking berechnet, relevant sind. Die „Rohdaten-Image-Datei“ wird in einen „Image-Crawler-ToDo“-Folder gelegt. Der googlebot-image-Crawler arbeitet diese ToDo Liste dann ab. Soll bedeuten: er besucht einige Zeit später die Seite und lädt das entsprechende Bild herunter. Auf dem google-Server wird es dann automatisiert klein-gerechnet (Thumb) und gespeichert.
Anschließend werden die neuen Bilder durch mehrere automatische Filter geschleust und kategorisiert (Gesichter, Fotos, Grafiken etc). Zusätzlich wird ihnen noch die Kategorie: „strikt safe“ oder „moderat safe“ zugewiesen. Tja, und dann könnten die Bilder eigentlich in den öffentlichen Index aufgenommen werden – aber… Nichts dergleichen.
Das google-Image-Update
Jeder, der bewusst neue Bilder in eine Seite integriert, kennt das: es dauert oft ewig, bis die Bilder in der Bildersuche erscheinen. Denn auch wenn google sie schon lange in der pipline hat, werden sie nicht automatisch in die „Bildersuche“ eingefügt. Aus bisher nicht erfindlichen Gründen lädt google die angesammelten neuen Bilder immer nur zu wenigen Zeitpunkten auf die öffentlichen Server: das google image-Update – zu deutsch: google Bildersuche Update. Dann landen plötzlich und auf einen Schlag riesige Mengen neuer Bilder in den Bildersuche-SERPs. Das gesamte Ranking wird dabei innerhalb weniger Stunden komplett neu geordnet.
Die google-Image-Update History
Da sich nur relativ wenige Webmaster und SEOs mit dem Thama beschäftigen, sind Beobachtungen relativ rar. Dennoch habe ich mal den Verusch unternommen, anhand meiner Beobachtungen und einiger Quellen eine Historie der bisherigen google-Image-Updates aufzulisten. Rechts in der Liste ist jeweils die Quelle angegeben. Die mit einem * gekennzeichneten Updates habe ich selber beobachtet.
Datum | PR-Updates [1] | Datum | Images-Updates | Quelle |
23.02.2009 | abgeschafft … |
siehe hier | ||
07.02.2009 | Image-Update | * | ||
27.01.2009 | Image Filter Update | * |
||
22.01.2009 | Image-Update | [20] * | ||
31.12.2008 | Pagerank-Update | |||
20.10.2008 | Image-Update | [2] * | ||
27.09.2008 | Pagerank-Update | |||
03.09.2008 | Image Filter Update | [3] | ||
26.07.2008 | Pagerank-Update | |||
17.07.2008 | Image-Update | [4] * | ||
08.07.2008 | Image-Earth-Update | [5] | ||
30.05.2008 | Image-Update | [6] [20] * | ||
30.04.2008 | Pagerank-Update | |||
04.04.2008 | Image-Earth-Update | [7] | ||
29.02.2008 | Pagerank-Update | |||
19.02.2008 | Image-Earth-Update | [8] | ||
12.01.2008 | Pagerank-Update | |||
26.10.2007 | Pagerank-Update | 26.10.2007 | Image-Update | [9] |
02.10.2007 | Image-Earth-Update | [10] | ||
26.07.2007 | Image-Earth-Update | [11] | ||
05.05.2007 | Image-Update | [12] | ||
30.04.2007 | Pagerank-Update | |||
29.03.2007 | Image-Earth-Update | [13] | ||
09.02.2007 | Image-Update | [14] [15] | ||
25.01.2007 | Pagerank-Update | |||
24.01.2007 | Image-Update | [16] | ||
28.09.2006 | Pagerank-Update | |||
13.07.2006 | Pagerank-Update | |||
10.7.2006 | Image-Update | [17] [18] | ||
16.4.2006 | Image-Update | [19] | ||
04.04.2006 | Pagerank-Update | |||
18.02.2006 | Pagerank-Update |
Tabelle: google-Image-Updates History seit 2006
Die pageRank Updates habe ich mit dargestellt, weil es natürlich von großem Interesse wäre, zu wissen, wann denn ein Image-Update stattfindet. Bisher dachte ich, dass es da einen Zusammenhang gäbe. Aber ich habe diesbezüglich nur eine leise Ahnung. Außerdem habe ich die Updates von google Image-Earth mit aufgenommen. Ob es da einen Zusammenhang mit der Bildersuche gibt, weiss ich auch nicht genau. Fragen über Fragen…
Meine bisherige Vermutung geht dahin, dass es technische Gründe gibt, warum die Bilder nicht „real-time“, sondern immer nur in großen Portionen in den Index aufgenommen werden.
Ausnahmen: News-Seiten und Video-Portale
Das google-Image-Update ist das große Nadelör in Bezug auf neue Bilder. Nur zu wenigen Terminen werden neue Bilder in den google-Index integriert. Zumindest betrifft das die große Masse. Aber es gibt auch Ausnahmen: So sollen die Bilder einiger News Dienste zeitnah indexiert werden. Ich werde das weiter recherchieren und demnächst darüber hier berichten.
Fazit
Wie gesagt: das Ganze ist nur eine These, die mir aus eigenen Beobachtungen plausibel erscheint. Die Beobachtungen, die ich in diversen Foren und Blogseiten zu dem Thema finden konnte, bestätigen das. Gleichwohl kann man natürlich immer nur eine sehr kleine Anzahl von Keys und Bildern im Auge haben (im übertragenen Sinne ;-) ). Und da das google Image-update nur so selten stattfindet, sind auch diesbezügliche Tests sehr langwierig und ungenau.
Ich wäre sehr dankbar, wenn jemand seine Erfahrungen zur Bildersuche hier beitragen könnte. Insbesondere bin ich an dem Ausbau der google-Images-Update Liste oben interessiert. Wenn also jemand Beiträge hat oder kennt, werde ich sie gerne in die Liste integrieren.
Weiterführende Links
- Häufig gestellte Fragen (FAQs) für Googles Bildsuche (Google-Seite)
- Bilder optimieren für google Bildersuche
- Googlebot Crawler Aktivität – Logfiles selber auswerten
- google Images Update Januar 2009
UPDATE 17.02.2009: Ich glaube, die google-Images-Updates gehören der Vagangenheit an. Zumindest legen das meine neuen Beobachtungen nahe: Google Bildersuche Update – Bilder immer schneller im Index
UPDATE 23.03.2009: Die Bilder gelangen mittlerweile tatsächlich täglich in den Index. Meist mit einer Zeitverzögerung von ca. 2 Wochen. Mehr hier: Google Bildersuche News I – Indexierung, Crawler, Homepage-Priorität
10 Gedanken zu „google Images Update – Wann und wie oft?“
Hallo, ich habe unsere alte Homepage am 7. Januar 09 komplett überarbeitet hochgeladen und die alte 100%ersetzt. Obwohl ich darauf geachtet habe, die alten urls beizubehalten, hat mir Google alle Bilder aus dem index gelöscht und bis jetzt ist noch kein einzig neues drinn. Deswegen besuche ich auch häufig deine nützliche Seite um mir die Wartezeit zu verkürzen, bis meine Bilder im Index auftauchen.
So nun meine Frage, du schreibst, dass Google nur verlinkte Bilder sammelt und führst Punkt 6 aus der Hilfe für SITEMAPS an! Es steht doch dass man keine direkten Bild-Urls in die sitemap integrieren kann, aber nix zum Suchalgorithmus des image-bots… (das schreib ich jetzt NACHDEM ich deinen Hinweis beherzigt habe und alle meine Bilder auf einer Homepage-Extraseite verlinkt habe– naja vielelichts hilf´s doch).
tschüss Stefan von der Wollhex
Hallo Stefan,
1. Ja, wenn man alte Bilder durch neue ersetzt, werden sie komplett aus dem Index gelöscht. Das gilt sogar, wenn die Bilder nicht nur einen identischen Namen und Pfad haben, sondern sogar bei gleicher Dateigröße. Also: wenn irgend möglich, die Bilder belassen und nicht mehr anfassen. Aber Ok, dafür ist es zu spät.
2. Das letzte images-Update war nach meiner Einschätzung vor wenigen Tagen. Das „jüngste“ Bild von mir, dass im Index ist, wurde am 16. November 2008 hochgeladen. Neuere Bilder sind noch nicht im Index.
Wenn deine Bilder erst Anfang Januar hochgespielt wurden, dann wird es noch etwas dauern. Zunächst musst Du das nächste images-Update abwarten – und dann hoffen, dass der Stichtag für die Indexierung nach deinem Uplaod war. Na, und dann muss der google-bot image deine Bilder natürlich auch erst einmal gecrawlt und heruntergeladen haben. Ich habe in einem Artikel beschrieben, wie Du dass ggf. selber prüfen kannst: http://www.tagseoblog.de/googlebot-crawler-logfiles-selber-auswerten
3. Entscheidend für die Bilder (und damit für den googlebot-image) ist ein Link zu dem Bild. Ob der Link auf eine Seite führt, auf der das Bild zu sehen ist, oder eine Blank-Seite mit dem Bild öffnet, ist egal. Der googlebot findet praktisch alle Bilder, die über reguläre Links zu erreichen sind. Die Sitemap wird scheinbar nur vom „normalen“ Crawler benutzt. Der images-Crawler kümmert sich wohl nicht darum. Daher brauchst Du die Bilder auch nicht in der Sitemap aufführen.
Nach meiner Einschätzung wirst Du noch ca. 8-12 Wochen warten müssen, bis Deine Bilder in der Bildersuche erscheinen. Aber vielleicht verkürzt Google auch die Perioden zwischen den Images-Updates.
Viel Erfolg, Martin
@ Stafan: Ich habe mir eben noch mal Deine Seite angesehen. Hinsichtlich der Bilder solltest Du noch mal über die Dateinamen nachdenken. Immer den gleichen key mit einem Zahlenanhang (z.B. „brettchenborten-brettchenborte-14“) bringt nicht viel. Besser wäre: „brettchenborte-moorleiche-daetgen“ oder so.
Wenn die Bilder eh noch nicht indexiert sind, würde ich es ggf. jetzt noch schnell überarbeiten. Ist zwar viel Arbeit, aber das Potential über die Bildersuche ist danach ungleich höher.
Hallo Martin,
das mit den etwas merkwürdigen Bildnamen ist so: Die Key-Suchwörter für meine Seite ist sowohl Brettchenborte als auch Brettchenborten. Bei Brettchenborten bin ich im Ranking an Pos.2 und für Brettchenborte an Pos.8 Diese beiden Suchbegriffe machen mit je 20% den Löwenanteil aus. Deshalb habe ich diese Methodik gewählt, die aber zugegebenermassen nicht Userfreundlich ist. Ich werde deinen Rat annehmen und einige Seiten nach deinem Vorschlag umbenennen und dann abwarten ;-).
tschüss Stefan
Juhu das Warten hat ein Ende!
Heute am 15.02.09 wurden die ersten drei Bilder meiner Homepage, die am 07.01.09 neu online ging, in den google-Bilderindex aufgenommen. Zwei Bilder waren mehrfach intern verlinkte Bilder (Logo und Aktionsbild) sowie ein kleines unbedeutendes Gif-Bild. Damit wäre Martins Theorie bestätigt, dass Google gerne Bilder am Anfang und am Ende einer Seite indiziert.
tschüss Stefan
Hi Stefan,
freut mich für Dich. Und danke für den Hinweis. Ich beobachte schon seit ein paar Tagen auffällige Bewegungen im Bilderindex. Entweder läuft gerade schon wieder ein Images-Update (eher unwahrscheinlich), oder google hat den Filter oder was auch immer so geändert, dass die Bilder nun „fließend“ in den Index integriert werden. Das wäre allerdings echt eine Überraschung. Na mal sehen.
Update: Gestern am 16.02 sind weitere 9 Bilder in den Bilderidex aufgenommen worden. tschüss Stefan
Kommentare sind geschlossen.