Hotlinking
Hotlinking ist eine weit verbreitete Methode, um Medien, vorrangig Bilder auf einer Website einzubinden. Das Ärgerliche daran: Google schenkt den hotlinkenden Seiten oft den Link aus der Google-Bildersuche. Daher ist Hotlinking eine beliebte Methode, um Traffic, also Besucher, von anderen Websites zu klauen.
Was ist ein Hotlink?
Bilder werden auf HTML-Websites mit Hilfe des <img …>-tags eingebunden. Der Aufruf der physikalischen Bilddatei (Jpeg, Gif oder PNG) erfolgt mit Hilfe des „src“-Attributs. Der Browser lädt dann das Bild vom angegebenen Server (oder auch Host) herunter und zeigt es an. Beim Hotlinking liegt das Bild auf einem anderen Server als die HTML-Seite selber.
Dass das Bild auf dem gleichen Server liegt, ist durchaus nicht Standard. Gerade größere Portale (mehr als 100.000 Bilder) sind längst dazu übergangen, ihre Bilder auf eigene Bilderserver auszulagern (auch als CDN bezeichnet: Content-Delivery-Network). Die Gründe dafür sind vielfältig und absolut nicht fragwürdig:
- Speicherplatz optimieren
- Redundanzen vermeiden
- Bilder / Medien asynchron laden verbessert die Ladegeschwindigkeit einer Website
Wikipedia, Amazon, Ebay, facebook und viele mehr binden also Bilder ein, die auf anderen Servern liegen.
Wie wird durch Hotlinking Traffic geklaut?
Wenn man in der Google-Bildersuche auf das vergrößerte Bild klickt – oder den Button „Website besuchen“, dann öffnet sich eine (die) Seite, auf der das Bild zu sehen ist. Solange Google nur eine Seite kennt, auf der das Bild zu sehen ist: kein Problem. Dann wird dieser Link als URL benutzt.
Aber: was, wenn das Bild auf zwei oder mehr Seiten eingebunden ist? Genau das ist in der Regel beim Hotlinking der Fall. Das Bild wird auf einer Original- bzw. Ursprungsseite gezeigt – aber dann auch auf der hotlinkenden Seite. Dabei spielt es (leider) keine Rolle, ob das Bild letztendlich auf der Seite auch tatsächlich zu sehen ist oder nicht. Allein das Einbinden einer Mediendatei mit Hilfe des „src“-Attributes genügt, um Google zu signalisieren, dass das Bild zu der Website „gehört“. Eine Medien-Ressource kann mit folgenden Methoden „verlinkt“ werden:
- img
- iframe
- href
- meta-Attribut im Header (z.B. Open Graph)
Das bedeutet: selbst wenn eine Website ein Bild nur verlinkt (mit <a href=“bild-url.jpg“>), ohne dass es mit einem <img> aufruf verbunden ist – das Bild ist demnach auf der Website gar nicht zu sehen), kann Google den Link aus der Google Bildersuche auf diese Website setzen.
Definition Hotlink
Ein Hotlink ist ein Bild (oder auch jedes andere Medium wie Video, PDF etc.), das über das „src“-Attribut auf einer Website eingebunden bzw. „verlinkt“ ist und das von einem anderen Server geladen wird.
Warum ist Hotlinking ein Problem?
Google hat also die Wahl, ob Seite A oder Seite B als Linkziel des Thumbnails dient. Nach welchen Kriterien Google diese Frage entscheidet, ist geheim und umstritten. Sicherlich spielen mittlerweile folgende Faktoren eine Rolle:
- Erste Indexierung des Bildes auf welcher Seite?
- Onpage-Relevanz (des Suchbegriffs in der Google-Bildersuche)
- Trust der Website
- Anzahl der uniquen Bilder der Website
- Aktualität der Website
Lange Zeit war die Aktualität ein sehr starken Faktor, was dazu führte, dass im die Seite verlinkt wurde, die am jüngsten war. Das führte zu folgendem Problem, das leider immer noch sehr häufig missbraucht wird:
Ein Website-Betreiber erstellt ein automatisiertes System, dass zu tausenden von trafficstarken Bilder-Suchbegriffen automatisch die ersten 5-10 Bildergebnisse abscant. Die Bild-Ressourcen werden auf automatisch generierten Websites einfach eingebettet oder auch nur verlinkt. Neben einigen automatisch geklauten Texten werden dann zahlreiche Werbebanner auf der Seite gezeigt. Fertig ist die Bilderfarm-Spam-Galerie.
Und was macht Google?
Google indexiert die neue Seite, und weil dort erstens sehr viele relevante Bilder zu finden sind, und die Seite jünger ist als alle anderen, verlinkt Google die Thumbnails mit den Spam-Seiten. Zum Teil wurden über 50% der Top-10-Bilder von Bilderpiraten mit Hilfe von Hotlinks gekapert. Vor allem Ingo Henze beschäftigt sich seit Jahren mit diesem Problem und hat zahlreiche Fallbeispiele beschrieben. Sehr häufig bemerken es die Rechte-Inhaber überhaupt nicht – und wenn doch: dann kann man meist auch nichts machen. denn die Seiten werden in Ländern betrieben, wo die deutsche Justiz kaum Eingriffsmöglichkeiten hat.
Einzige Lösung bleibt eine Meldung bei Google. Doch leider: selbst wenn Google diese Domain dann ausschaltet, hat der Inhaber des automatisierten Systems längst eine andere Domain registriert, mit der in Minutenschnelle ein neuer Klon erzeugt wird. Eine scheinbar never-ending-story zulasten der Bildrechte-Inhaber, die das meist überhaupt nicht merken.
Was tun gegen Hotlinking?
Für den Website-Betreiber gibt es praktisch keine Möglichkeit, Hotlinking zu unterbinden. Zwar kann man via htaccess bestimmte Domains aussperren (siehe dazu diesen Artikel von Daniel Weihmann), so dass die eigenen Bilder dort nicht angezeigt werden. Aber man weiß ja nicht vorher, welche neuen Spam-Domains es gibt. Erst wenn diese Domains in der Bildersuche verlinkt werden, kann man aktiv werden. Aber da die Bildersuche immer noch relativ träge ist, vergehen oft Tage oder Wochen, ehe sich die Linkziele in der Bildersuche ändern. Bis dahin ist längst eine neue Domain am Start…
Es gibt keine Lösung …
Die einzige Möglichkeit, das Hotlinking-Problem zu lösen, liegt bei Google. Dort müsste man die Kriterien für die Thumbnail-Links anpassen. Aber wie sollte das gehen? Bilder auszulagern ist ein vollkommen sinnvoller Prozess.
- Wenn Google nur Linkziele zuließe, die auf dem gleichen Server liegen wie die Website, würden Wikipedia, Amazon, und so weiter alle aus den Bildersuche-Ergebnissen fliegen. Geht nicht.
- Die Website der ersten Indexierung zu nutzen ist auch schwierig. Erstens könnte das Bild vorher schon woanders eingebunden gewesen sein, und der Crawler hat es nur nicht bemerkt. Und zweitens spricht auch einiges für die Methode, den jeweils aktuellsten Artikel zu dem Thema zu bevorzugen.
- Entscheidend ist sicherlich die Onpage-Relevanz eines Artikels, aber: die ist gerade hinsichtlich der Suchintention in der Bildersuche meist kaum klar zu definieren. Weill jemand, der ein Thumbnail in der Bildersuche anklickt, eher eine Website mit langem Text und dem einen Bild? Oder will man eher eine Sammlung zahlreichen Bilder? Onpage-Relevanz ist alsentscheidendes Kriterium also auch fragwürdig.
Kurzum: das Hotlinking-Problem ist systemisch bedingt und in absehbarer Zeit nicht zu lösen. Wir alle werden damit leben müssen, dass kriminelle Programmierer unsere Bilder für ihre egenen Zwecke missbrauchen. Zumindest, solange sie sich auf vorderen Positionen der Google Bildersuche befinden.
Wer das Thema weiter verfolgen möchte, sollte unbedingt auch den Schnurpsel-Blog von Ingo abonnieren oder bookmarken.