Wie man Bilder aus der Google Bildersuche ausschließt
So, nach der Aufregung nun noch mal etwas Sachliches, fast Einfaches :-) Im Folgenden eine kurze Beschreibung, wie man Bilder aus der Google Bildersuche ausschließt. Wer das lang und kompliziert haben möchte, siehe hier: „Bilder aus der Google Bildersuche entfernen / löschen„. Aber es gibt auch eine Kurzfassung. Man muss ein kurzes Codesnippet in der robots.txt einbauen. Aber: selbst dann dauert es noch mehrere Wochen, ehe die Bilder tatsächlich verschwunden sind. Grundlage der Google-Indexierung ist ein Crawler, der sich in den Logfiles als „googlebot“ zu erkennen gibt. Für die Bilder gibt es einen speziellen Crawler, den Googlebot-Image.
Um zu vermeiden, dass Google die Bilder indexiert, muss man dem Crawler sagen, was er darf und was nicht. Das passiert in der „robots.txt“, eine text-Datei, die im root-Verzeichnis einer Domain liegen muss, Beispiel. Hier ein paar exemplarische Snippets, wie man den Googlebot-Image steuern kann. Zunächst der Befehl, wenn man nur ein bestimmtes Bild aussperren möchte:
User-agent: Googlebot-Image Disallow: /bilder/meinbild.jpg
Der folgende Befehl verbietet es dem Googlebot, Bilder aus dem Ordner „Bilder“ zu indexieren.
User-agent: Googlebot-Image Disallow: /bilder/
Man kann aber auch nur bestimmte Bildtypen ausschließen, zum Beispiel Gifs:
User-agent: Googlebot-Image Disallow: /*.gif$
Wer konsequent gar keine Bilder mehr indexieren lassen möchte, benutzt einfach die folgende Anweisung:
User-agent: Googlebot-Image Disallow: /
Dieser letztgenannte Befehl bedeutet, dass der Googlebot aus keinen Unterorder mehr Bilder mitnehmen darf. Hier noch mal eine Übersicht bei Wikipedia über die Robots.txt-Anweisungen. Der Googlebot hält sich in aller Regel an die Vorgaben aus der robots.txt. Mir ist kein Fall bekannt, wo Bilder indexiert wurden, die ausgeschlossen wurden. Aber …
Problem: was ist mit bereits indexierten Bildern?
Das Gesagte bezieht sich auf neue Bilder. Völlig unklar ist mir ehrlich gesagt, wie das eigentlich mir bereits indexierten Bildern ist. Ich bin mir nicht sicher, ob die Anweisung in der robots.txt dazu führt, das bereits indexierte Bilder wieder deindexiert werden. Farge an Ingo, bzw. alle: wer hat hier Tests oder Erfahungswerte? Ich habe eben einen Test aufgesetzt…
Wer ersetzt eigentlich den Arbeitsaufwand?
Um auf Nummer Sicher zu gehen, müsste man alle Bilder löschen und unter anderem Dateinamen erneut hochladen und erneut in den Artikeln einbinden. Das ist in vielen Fällen ein enormer Arbeitsaufwand – und das wegen eines willkürliches, unvorhersehbaren Google-Update. Wer kommt eigentlich für diesen Arbeitsaufwand auf? Im Grunde müsste es an Google sein, die gesamten Inhalte der Bildersuche zu löschen und erneut zu starten.
Das dauert …
Ach, noch etwas zu den Zeiten: der Googlebot ist bei den meisten Seiten eher langsam. Außerdem löscht er Bilder auch nicht sofort, sondern schaut später noch mehrmals vorbei, ob ein Bild vielleicht doch noch vorhanden ist. Es dauert deshalb in der Regel einige Wochen, manchmal Monate, ehe bereits indexierte Bilder tatsächlich aus der Google Bildersuche verschwunden sind. Wenn die neue Bildersuche innerhalb weniger Tage in Deutschland freigeschaltet würde, dann hätte man gar nicht die Chance, die Bilder rechtszeitig zu löschen…
10 Gedanken zu „Wie man Bilder aus der Google Bildersuche ausschließt“
Hi Martin. Kann man nicht für Dateien wie PDFs, Bilder, etc noindex via .htaccess setzen? Das sollte dann für alle Bilder funktionieren, alte und neue.
@Susanne: Genau! Oder noch einen Schritt weiter: Dem Googlebot-Image Bildversionen mit deutlichem Wasserzeichen anbieten, so dass Besucher, die das Bild ohne Wasserzeichen sehen wollen, evtl. doch zur Quelle zu klicken.
Nur so! Ohne Wasserzeichen geht gar nichts mehr. Tom
Idee:
Nur noch Thumbs für den Index freigeben.
Andere Bilder per robots.txt sichern.
Die bereits indizierten Bilder z.B. hiermit:
http://support.google.com/bin/static.py?hl=de&ts=1114905&page=ts.cs
aus dem Index entfernen.
„Wenn die neue Bildersuche innerhalb weniger Tage in Deutschland freigeschaltet würde, dann hätte man gar nicht die Chance, die Bilder rechtszeitig zu löschen…“
Immerhin könnt ihr dann bei einer Klage auch gut beweisen, dass Google VORSÄTZLICH auf Urheberrechtsverletzung aus war, weil es ja gar nicht möglich war, von Kenntnisnahme des Updates bis zum Livegang den Ausschluss der eigenen Bilder zu erreichen.
Erst mal vielen Dank für die umfassende Materialsammlung über die neue Google-Bildersuche.
In einem kleinen Punkt kann ich aber vielleicht Entwarnung geben: die Fotos können offenbar auch über die .htaccess gesperrt werden. Hierzu gibt es ja den Codeschnipsel, der ein Alternativbild anzeigt, wenn das Bild auf einer anderen Domain angezeigt wird, als der eigenen.
Hier mal ein Screenshot.
Der Nachteil (allerdings noch mit Vorsicht zu genießen: ich vermute nur, daß dies so ist) : bei Verwendung eines Framebreakers wird das Alternativbild auch auf der eigenen Webseite angezeigt. Das ist nicht ganz im Sinne des Erfinders :-P
Allerdings läßt sich hier vielleicht noch etwas mit einem Redirect in der htaccess rumspielen. Werde das auf jeden Fall mal ausprobieren :-)
Was mir noch auffiel: kann es sein, daß die Bildersuche auf google.com (noch?) nicht mit jedem Browser funktioniert?
Ok, Update… das eben war leider alles Bullshit. Sobald das Alternativbild einmal angeklickt ist, funktioniert das leider nicht mehr. Offenbar ist dann eine 1:1 Kopie auf den Google-Servern. DAS ist Bilderklau vom Feinsten :-(
Kommentare sind geschlossen.