Google Analytics – Datenschutz-Problem oder typisch-deutsch?
Google und der Datenschutz – dieses Thema wird in diesem Jahr sicherlich noch ein heißes Eisen. In diesem Artikel soll es um ein Teil dieses Puzzles gehen: Google Analytics. Denn dieses Tool ist für viele Seos und Webmaster von fundamentaler Bedeutung, wenn es darum geht, eine Website zu optimieren. Falls der Einsatz von Google Analytics rechtswidrig würde, wären Tausende SEOs gezwungen, ihren Job aufzugeben oder in die Illegalität abzutauchen. „Zu heiß gekocht„? „Typisch deutsch„? „Ich nutze persönliche Daten ja gar nicht„? … – Ich glaube, es gibt in der SEO- und Webmaster-Szene ein weit verbreitetes Missverständnis über die Frage, was eigentlich das Problem ist. Hier meine Sicht der Dinge…
Für diejenigen, die nicht so in der Materie stecken, eine kurze Zusammenfassung, worum es geht. Die meisten Stammleser dieses Blogs können diesen Abschnitt überspringen :-)
Was ist und was kann Google Analytics?
Mit Hilfe von Google Analytics erhalten angemeldete Webmaster Informationen über das Besucherverhalten auf ihrer Website. Ein kleines Script, das sich im Quellcode der Seite befindet, übermittelt bei jedem Seitenaufruf eine Reihe von verfügbaren Daten an einen Google-Server. Dort werden diese Daten dann gesammelt. Man kann sich vorstellen, dass da einiges an Daten zusammenkommt. Die technische Infrastruktur (Server, Festplatten, Netzwerke etc) wird Google einiges an Ressourcen abverlangen. Schon an dieser Stelle kann man sich fragen: Warum macht Google das eigentlich? Völlig kostenlos und ohne Hürden? Wie hoch sind eigentlich die Kosten dieses Systems – und wie rechnet sich das für ein börsennotiertes Weltunternehmen? Dazu unten mehr…
Bleiben wir zunächst beim Thema: ein Webmaster kann nun alles so gesammelten Daten in seinem Google-Anayltics-Account statistisch aufbereitet auswerten. Man kann so zum Beispiel sehen, welche Seiten am häufigsten angeklickt werden, über welche Keywords die Besucher aus einer Suchmaschine auf die Seite gesprungen sind, wie lange sie dort bleiben und so weiter und so fort. Die Daten sind extrem hilfreich und die Grundlage für jede Art von Optimierung einer Website.
Das Problem: die IP-Adressen
Der größte Teil der Daten, die von Google gesammelt werden, ist rechtlich vollkommen unproblematisch. Denn solche Erhebungen können jederzeit und überall gemacht werden, solange sie anonym sind. Aber genau hier gibt es bei Google-Analytics ein Problem: die Daten werden zusammen mit einer IP-Adresse gespeichert. Diese IP-Adresse ist so eine Art virtuelle Adresse. Sie kann (theoretisch) einem konkreten Ort und damit in den allermeisten Fällen einer konkreten Person zugeordnet werden.
Wenn Google die Datenabfrage umdreht – und nicht mehr eine Website als Ordnungskriterium nutzt, sondern die IP-Adressen, kann sich wunderbar ein „Nutzerprofil“ erstellen lassen. Alle besuchten Websites einer IP würden zu einem konkreten Bild werden: in welchen Shops bewegt man sich, welche Interessen hat man, und so weiter. Google sagt natürlich: „Das mach wir nicht.“ Aber wer genau hinhört, mag eine gehauchtes „Noch nicht“ erahnen.
Datenkrake Google – wie lange noch „not evil“?
Google greift aber natürlich nicht nur auf Analytics-Daten zurück. Durch die Fülle unterschiedlicher Anwendungen fließen zahlreiche Daten zusammen, die durch ihre Verquickung erst so richtig massiv werden: der „gläserne Mensch“ ist realer, als viele glauben, wenn auch noch virtuell. In diesem Zusammenhang möchte ich auf ein Interview hinweisen, in dem Google CEO Eric Schmidt sinngemäß sagt:
„Wenn du etwas tust, von dem du nicht möchtest, dass jemand anders es weiß, solltest du es vielleicht gleich gar nicht tun“ (Quelle: CNBC-Interview-Ausschnitt bei youTube)
Bislang kann man Google nicht nur indirekt vorwerfen, diese Datenmacht zu „missbrauchen“. Mit zunehmender Datenfülle kann Google immer neue „Dienste“ anbieten, die von den einen als hilfreich und von anderen als Eingriff in die individuelle Freiheit bewertet werden. Personalisierte Suchergebnisse bzw individuelle Werbung auf Google-Seiten werden zwar heiß diskutiert. Aber meist geht es dabei weniger um die Fragen der individuellen Freiheit als vielmehr um die Auswirkungen hinsichtlich der Suchmaschinenoptimierung (z.B. bei Seo-United oder bei Selbständig-im-Netz). Dieser Fokus auf die Umstellung der SEO-Praktiken scheint den Blick auf das wesentliche Problem allerdings zu vernebeln.
Webmaster im Dienste Googles
Bis vor kurzem dachte ich: „Naja, ist nicht so schön, dass Google meine Daten sammelt, aber naja, so schlimm ist es nicht. Ich habe keine Geheimnisse„. Aber nach einiger Recherche habe ich gemerkt: die Sorge um die eigenen Daten ist im Falle eines SEOs oder Webmasters gar nicht so wichtig. Für einen Website-Betreiber stellt sich die Frage noch aus einer ganz anderen Perspektive. Es geht um die Frage, welche Verantwortung man durch den Einsatz von Google-Analytics trägt. Denn: Google-Analytics ist sicherlich ein wichtiger Baustein in der großen Datensammelmaschine. Jeder, der den Google-Analytics-Code auf seiner Website einbaut, hilft Google dabei, seine Datensammlung auszubauen. Und damit erhält die Frage oben „Warum bietet Google seinen Analytics-Service eigentlich kostenlos an?“ auch eine Antwort: Der Preis sind die Nutzerdaten, die man Google zuspielt.
In den Datenschutzbestimmungen der personenbezogenen Werbung steht der Satz „[…] Unsere Kunden können bestimmen, welche Informationen sie an uns weitergeben möchten“. (Quelle) Allerdings hat kaum ein „normaler benutzer“ die Chance, sich der Übermittlung seines Benutzerverhaltens via Google-Analytics zu widersetzen. Denn die allermeisten Internet-User ahnen gar nicht, dass wir Webmaster und SEOs ihre Daten an Google verkaufen, damit wir unsere eigenen Statistiken von Google sehen dürfen.
Was tun? Piwik?
Als Seo kann man eigentlich gar nicht auf die Auswertung des Benutzerverhaltens verzichten. Wie sollte das gehen? Aus den logfiles könnte man zwar noch rausklauben, wie viele Besucher eine Seite hat und welche am häufigsten angesehen wird. Aber im Grunde wäre Suchmaschinenoptimierung auf dieser Basis nur ein Gestocher im Nebel.Eine einigermaßen solide Tracking-Software ist also erforderlich.
Ich werde bei nächster Gelegenheit mal die openSource Tracking-Alternative PIWIK installieren und sehen, welche Auswertungsmöglichkeiten es dort gibt und wie sie angeboten werden. Immerhin fließen die persönlichen Daten der Besucher meiner Websites dann nicht mehr in die große Datensuppe Google. Denn bevor wir alle Daten dieser Welt in den Rachen eines amerikanischen Superschuppens kippe, bleibe ich doch lieber „typisch deutsch“…
Wenn ich brauchbare Informationen über PIWIK habe, werde ich natürlich darüber berichten. Update 08.04.2010: Piwik wird nun auch als „One-Klick-Installer“ bereitgestellt. Damit entfällt die aufreibende Installationsorgie. Für viele wird es nun deutlich einfacher, Piwik zu installieren. Probiert es aus :-)
Dieser Artikel entstand im Rahmen des Webmasterfriday – Thema diese Woche: „SEO und Datenschutz – Google Analytics rausschmeißen?“
Wer sich direkt bei Google über die aktuellen Datenschutz-Richtlinien informieren möchte, findet die Seiten hier: www.google.com/intl/de/privacy.html – Ich gebe jedoch zu bedenken, dass nicht alles, was heute gilt, auch noch in einigen Jahren gilt. Die Geschichte der Konzern-Kehrtwendungen – gerade bei Aktienunternehmen – ist lang. Denn wie man in vielen aktuellen Beispielen sieht: das Wohl des Firma steht im Zweifelsfall über dem Allgemeinwohl.
Zu dem Thema gibt es bereits einen guten Artikel von Stefan Fischerländer, der sich auch Gedanken über Google Datenmacht macht: „Gedanken zum Google Datenschutz„. Auch bei Heise gibt es einen langen und gewohnt informativen Artiekl zum Thema „Der Datenkrake„. Und auf die rechtlichen Risiken samt aktueller Urteile weist ein gut verständlicher Artikel auf Akademie.de hin „Rechtsrisiken beim Einsatz von Google Analytics & Co„.
Update 25.01.2010: Aus aktuellem Anlass hier noch ein gnadenlos frischer Artikel, der ins Bild passt: „Funkt die Google Toolbar nach Hause, auch wenn es der Nutzer abgeschaltet hat?“ von t3n. Man beachte allerdings, dass es sich um eine (unverifizierte) Frage handelt…
27 Gedanken zu „Google Analytics – Datenschutz-Problem oder typisch-deutsch?“
Hallo Martin,
ein schöner Artikel! Wir setzen seit einiger Zeit PIWIK ein, allerdings hat es sich nicht wirklich als echte Alternative zu GoogleAnalytics, Etracker, Webbtrekk und Co. erwiesen, weil der Funktionsumfang in den analytischen Funktionen (noch) zu gering ist.
-sebastian
Hallo Martin,
interessanter Artikel.
Ich habe Piwik vor einem guten halben Jahr mal mehr oder weniger ausführlich getestet.
Mist, ich hätte drüber bloggen sollen :D
Piwik ist für mich keine Alternative.
Die wichtigsten Daten, sprich Visits, Hits, Referer, Keywords, Bounce Rate oder Länge der Besuchszeit, werden zwar in einer recht ansprechenden Form dargestellt, aber das wars auch eigentlich schon.
Ziele, Navigationen oder sonstige wichtige Dinge fehlen schlichtweg derzeit.
Ein weiterer SEHR großer Nachteil von Piwik ist, dass man die Daten bei sich selbst auf dem Server/in der Datenbank lagern muss.
Bei rund 2000 Besuchern und rund 20.000 Hits am Tag kommen da schon so einige hundert- oder tausende Kilobyte zusammen. Bei 5 MB pro Tag wären das bereits fast 2 Gigabyte Daten. Das frisst nicht nur eine Menge Kapazität, sondern frisst auch enorme Ressourcen.
Je größer die Datenbank wird, desto langsamer ist auch Piwik, da Daten immer aufbereitet und aktualisiert werden müssen.
Bevor das jetzt ein Endlos-Roman wird, lass ich den anderen Kommentatoren auch mal Platz *g*
Danke fürs Feedback. Ja, das habe ich schon oft gelesen, dass Piwik keine sooo gute Alternative ist. Und das mit den Daten auf dem eigenen Server zeigt nur einmal mehr, welche Ressourcen Google dafür zur Verfügung stellt – gigantisch. Kann mir doch keiner erzählen, dass die das nicht irgendwann monetarisieren…
„Kann mir doch keiner erzählen, dass die das nicht irgendwann monetarisieren…“
Soviel wie ich weiß nutzt google sämtliche Dienste, um Werbung besser zu personalisieren und so weiter….
Daher monetarisiert google schon seit Anfang an, nur eben indirekt ;)
Hallo,
ich sehe die Problematik mit Google Analytics ähnlich und bin daher vor einiger Zeit auf Piwik umgestiegen.
Meiner Meinung nach sollte jeder Webmaster verantwortungsvoll mit den Daten seiner Besucher umgehen und diese nicht freiwillig in Google’s Datensammlung einspeisen. Schon allein aus Respekt vor dem (ahnungslosen) Besucher, der seine Privatsphäre schützen möchte.
Momentan sind die erhoben Daten in Deutschland aufgrund der dynamischen IP-Vergabe vielleicht noch nicht so brisant, allerdings wird in Zukunft (ipv6) wahrscheinlich jeder Internetnutzer eine statische IP erhalten und Google kann somit – dank der enormen Verbreitung von Analytics – beinahe das gesamte Surfverhalten eines jeden Nutzers tracken…
In anderen Ländern sind statische IP’s schon heute Standard.
Piwik bietet zwar nicht den selben Funktionsumfang wie Google Analytics, lässt sich durch eine umfangreiche API allerdings gut erweitern und an die eigenen Bedürfnisse anpassen… Und umso mehr Entwickler Erweiterungen schreiben oder direkt mithelfen, umso schneller wird der Funktionsumfang von Piwik mit Google Analytics mithalten können.
Zum Speicherbedarf: Für einen SEO, der gutes Geld mit seinen Websites verdient, sollte dies kein Ausschlusskriterium sein. Die Privatsphäre der Nutzer sollte einem ein paar Euro pro Monat wert sein. Für 100 MB kann man ca. 72000 Besucher und 320000 Pageviews aufzeichnen.
Viele Grüße
Marco
Hi,
kann mich meinem Vorredner eigentlich nur anschließen und sehe es eigentlich als enormen Vorteil, dass man die Daten auf eigenem Webspace lagert.
Ich nutze Piwik nun seit etwa 2 Monaten parallel zu Analytics.
Desweiteren hat Piwik noch einen enormen Vorteil:
Wenn man Piwik auf jedem Server bzw. auf jedem Webhosting Paket einzeln installiert, wird man den Footprint von GA los ;)
Ja ich weiss, man könnte ja auch für jede Website nen eigenen Analytics Account erstellen, aber hey…das macht doch keiner und würd eh nix bringen…Google merkt zu schnell, dass einem 5 Accounts gehören ^^
Als weitere Ergänzung hier ein sehr hörenswertes Interview zum Thema Datenschutz:
http://www.netzpolitik.org/2009/netzpolitik-podcast-080-frank-rieger-ueber-die-vorratsdatenspeicherung/
Und hier noch Udo Vetter in der Blogger Interview Reihe vom dctp: http://www.dctp.tv/meinungsmacher/udo-vetter-lawblog/
Lg
Marc / Marxeo
Hmpf,
kommentieren muss ich echt noch üben xD Hab nen paar Sätze vergessen zu schreiben *pfeiff*
Weiteres zu Piwik:
Piwik hat zwar noch nicht die Qualität und Feinheit von Google Analytics, entwickelt sich aber relativ schnell.
Piwik ist auf jeden Fall immer eine Erwähnung wert. Genau wie eigentlich jedes andere Open Source Projekt entwickelt es sich mit der Community, größere Community bedeutet i.d.R. mehr qualitative Coder die dran teilnehmen.
Und möchte man nicht direkt an der Weiterentwicklung teilnehmen, gibt es immernoch die Möglichkeit die API zu nutzen.
Lg und sorry für mein übereiltes „Submit geklicke“ beim vorherigen Kommentar.
Marc alias Marxeo
Wird jemals ein Analytics Tool an das von Google rankommen ist die Frage. Ich habe bis jetzt mit anderen „Nachahmern“ nur Fehlgriffe gemacht und es war noch nichts annehmbares dabei.
Hallo Martin,
was mir in deinem Artikel fehlt ist, dass GA aktuell gegen geltendes Recht verstößt (je nachdem auf welchen Richter man trifft) und mit einem Bußgeld bis 50.000 geahndet wird.
Das liegt nicht an GA, sondern daran, dass:
1. Die IP-Adresse als personenbezogene Information eingestuft wird (gleichzusetzen mit der E-Mail-Adresse).
2. Die personenbezogene Daten ohne Einwilligung auch noch ins EU-Ausland geschafft werden.
Den Datenschützern geht es in erster Linie um reichweitenstarke Portale und Behörden. Ebenso betonten sie, dass sie nicht abmahnen ohne vorher Kontakt zu suchen.
Allerdings ist das im worst case die Grundlage für eine neue kranke Abmahnwelle:
http://www.anonym-surfen.com/11-illegale-dinge-die-fast-jeder-webmaster-macht/
Ich habe im Dezember ausführlich darüber berichtet und auch ein Interview mit einem Rechtsanwalt geführt, um diese schwammige rechtliche Lage halbwegs aufdecken zu können:
http://www.anonym-surfen.com/ip-adresse-als-personenbezogene-information/
Ich hoffe, die Eigenwerbung ist gestattet. Aber das ist ein Thema mit dem sich jeder Webmaster auseinander setzen sollte.
Und zum Abschluss: Alleine der Umstieg auf Piwik genügt nicht. Die IP-Adresse muss anonymisiert gespeichert werden, was Piwik nicht tut.
@Dennis: vielen Dank für die Hinweise. Dass Piwik nicht ohne IP-Adressen auskommt, habe ich mir schon gedacht. Nun muss man abwarten, was die Richter dieser Republik entscheiden, bevor es zu einer grundsätzlichen Klärung kommt. Ich bin mir ziemlich sicher, dass dann alles umgekrempelt werden muss…
mmh, dies lässt sich sicher ändern… Denkbar wäre beispielsweise die IP nur während einer Session (daher ca. 10min – 2h) zu speichern, direkt auszuwerten (z.B. Herkunftsland des Besuchern) und für die Archivierung kann dann nur der Hash-Wert der IP aufbewahrt werden.
So wäre die Privatsphäre des Besuchers – ohne den Verlust von Tracking Informationen – geschützt.
@Dennis: Dann mag ich auch etwas Eigenwerbung hinterherschieben. ;) In meinem Beitrag Piwik: Keine IP-Adressen speichern habe ich kurz und knapp erklärt, wie man die Speicherung der IP unterbindet. Einziger Haken: Es kann leichte Messfehler in Bezug auf die Unique-Nutzer geben, wenn die Besucher keine Cookies zulassen. Bei meinen Seiten sind Schwankungen dadurch aber nicht wirklich bemerkbar.
@all: „Eigenwerbung“ ist doch Blödsinn. Wer interessante und weiterführende Infos oder Artikel zum Thema hat, bitte gerne her damit. Das freut und interessiert nicht nur mich, sondern alle Leser. (Hier geht es um ein Thema und nicht um blöde Verlinkungsvorbehalte…)
Daher: danke für das konstruktive Feedback – ich werde meine Meinung zu PIWIK kundtun, wenn ich es getestet habe…
Hallo,
bin jetzt nicht so der Super-SEO-Techniker wie der Rest hier, aber ich hatte selbst vor ein paar Monaten für mein Blog recherchiert und fand:
http://www.web-analytics-nutzen.de/web_analytics/2009/11/opt-out-tracking-code.html
und
http://www.analytics-anonym.de/
Einmal Opt-Out mit Javascript, einmal Anonymisieren der IP.
Spricht da was gegen (ausser den Datenqualität…)?
Gruesse
C.K.
also ich würde sagen „typisch deutsch“, keine Ahnung von Technik, aber gleich gleich mal direkt anprangern…. die Daten fallen nunmal an auf einem Server, und ob man die per Analytics auswertet und sich ein eigenes Tool in den Hintergrund schiebt und arbeiten lässt, macht keinen wirklichen Unterschied. Analytics ist halt derzeit noch am mächtigsten und versteht es viele verschiedene Datenquellen zu verknüpfen.
Grüße
Nicos
@Andre: Deins wäre aus Datenschutzsicht eine Lösung. Aber dann sind die Statistiken imo unzureichend. In der „Common.php“ gibt es eine Funktion „getIp()“. In dieser kann man die IP-Adresse anonymisieren.
@Christoph: Dieses „OptOut“ und die Kommunikation der Datenschutzerklärung muss aber VOR dem ersten Protokollieren geschehen. D.h., standardmäßig wird nix protokolliert und nur wenn der Besucher die Checkbox anhakt, darf der Webseitenbetreiber protokollieren.
Bei der Strategie kannst du das Analysewerkzeug auch gleich ganz weglassen, da kaum Daten zusammen kommen und die dann überhaupt nicht aussagekräftig sind.
Es ist echt ein schwieriges Thema. Mit GA riskiert jeder Webmaster Abmahnungen. Mit Piwik sind die Statistiken weit weniger komfortabel und schwieriger auszuwerten.
@Dennis: „Es ist echt ein schwieriges Thema. Mit GA riskiert jeder Webmaster Abmahnungen. Mit Piwik sind die Statistiken weit weniger komfortabel und schwieriger auszuwerten.“
Genau. Als SEO kann man es sich gar nicht leisten, nicht wenigstens eben so gute Tools wie die Konkurrenz zu benutzen. Genau in dieser „Zwickmühle“ stecken gerade alle…
Hallo,
super Beitrag! Also ich nutze derzeit in vielen Projekten Piwik, da es wegen Google Analytics zu viel Streß gab und ich in Piwik noch relativ viel Potential sehe.
Zwar kommt es noch lange nicht an den Umfang von Google Analytics heran, allerdings habe ich die volle Kontrolle über die Daten, habe alles auf meinem eigenen Server und kann Kunden Zugangsrechte für Ihre Daten geben. Bei Google ging das nur, wenn die auch einen Google-Account haben.
In meinem Blog habe ich vor Kurzem übrigens auch über Piwik berichtet, insbesondere darüber, wie man Piwik noch Datenschutzgerechter macht. (Teilanonymisierung der IP, Opt-Out-Cookie).
Ich hoffe, dass Piwik in Zukunft noch weiter an die Google-Funktionen kommt. Als Ziel haben die Entwickler das ja.
Gegen übermäßigen Space-Verbauch durch Analytics-Daten könnte es helfen, alte Daten zu löschen, sobald die nicht mehr benötigt werden. ;)
Ich hab bezüglich Google Analytics – Abmahnung und Datenschutz ein Interview mit einer Rechtsanwältin geführt: http://www.elexpress.de/archives/2010/02/08/google-analytics-und-der-datenschutz-interview-mit-einer-rechtsanwaltin/
danke für diesen Artikel! wenn man jetzt mal von dem ganzen (durhaus wichtigen) Datenschutzkram absieht, finde ich die Sache mit den Footprints gerade im Bereich SEO viel interessanter (und auch nerviger).
Hat jemand von euch mal von einer praktikablen Lösung gehört, den host im javascript zu maskieren? Außer dem Piwik-Connector, der nich alle Daten liefert, habe ich keine Möglichkeit gefunden zentral mehrere piwik-installationen einzusehen. Folglich bleibt ja nur die Lösung mit zig Installtionen un zig Logins, um sein Netzwerk nicht aufzudecken…
Hallo!
Ihren Artikel finde ich relativ interessant und kann nur zustimmen, dass Daten, die personalisiert und massenhaft an einem Ort gespeichert werden, ein Risiko darstellen.
Da wundere ich mich bei Ihrer Kritik aber, dass Sie GoogleAnalytics, GoogleAdSense und WordPressStats trotzdem nutzen.
WebSEO’s haben viele Alternative Möglichkeiten, da Daten sensibel sind, sollte man diese auch entsprechend behandeln – wer das nicht tut, ist meiner Ansicht nach ein Egoist.
Ich wünsche noch viel Erfolg und eine gute Datensammlung.
Mit freundlichen Grüßen
Anonymer
Kommentare sind geschlossen.