JAP -- ANONYMITY & PRIVACY

<- WWW-Privatsphäre Inhalt Techniken der Datensammler ->

Datensammler im Kurzporträt

Viele Nutzer der kostenfreien Angebote von Google, Facebook & Co. sehen sich als Kunden dieser Firmen. Das ist falsch. Kunde ist der, der bezahlt. Die Webangebote von Big Data werden im Interesse der Kunden und des eigenen kommerziellen Erfolges gestaltet und optimiert. Datenschutz für Nutzer spielt dabei nur eine untergeordnete Rolle.

Im Folgenden werden vier populäre, datensammelnde Firmen kurz vorgestellt.

Google

Dass Googles Geschäftsmodell auf der Auswertung von gesammelten Daten basiert, ist allgemein bekannt. Viele Nutzer haben aber keine Vorstellung vom Umfang der erstellten Persönlichkeitsprofile und vom Wert dieser Daten.

Wirtschaftliche Zahlen: Nach Schätzung von Experten arbeiten in verschiedenen Rechenzentren ca. 1,5 Millionen Server für Google. Alle drei Monate kommen 100.000 Server dazu. Die jährlichen Kosten für diese Infrastruktur werden auf 2 Milliarden Dollar geschätzt. Insgesamt beträgt der Umsatz 30 Milliarden Dollar pro Jahr mit 7 Milliarden Dollar Gewinn. 96 Prozent des Umsatzes wird durch individualisierte Werbung generiert. (Stand 2009)

Die gesamte Infrastruktur steht Nutzern kostenlos zur Verfügung. Sie wird nicht mit Geld bezahlt, sondern mit Daten. Nach Ansicht der Electronic Frontier Foundation (EFF) wird bei Google der gesamte Datenverkehr protokolliert und kann anhand verschiedener Merkmale eindeutig bestimmten Personen zugeordnet werden. Das betrifft die Nutzung der Suchmaschine, die Nutzung von Googles Diensten, wie YouTube oder Google Earth, Werbeeinblendungen auf anderen Webseiten und natürlich die Tracking-Programme, wie Google Analytics. Die Basisdaten werden zu umfassenden Profilen der Surfer zusammgefasst. Aufgrund seiner Popularität kann Google fast das gesamte Such- und Surfverhalten erfassen. In Deutschland gehen 89 Prozent der Suchanfragen direkt an Google. Daneben sind ca. 85 Prozent der deutschen Webseiten mit Elementen verschmutzt (Google Analytics, Werbeeinblendungen usw.), die Google das webseitenübergreifende Tracking der Surfer ermöglichen.

Wie genau und wie umfangreich die Persönlichkeitsprofile von Google sind, kann man nur schwer abschätzen. Als Basis können die Daten dienen, die der Konzern Werbepartnern zur Verfügung stellt. Das folgende Bild zeigt die aggregierte Statistik für eine nicht näher genannte Webseite:

Besucherstatistik

Neben Alter und Geschlecht kann Google also auch den Bildungsgrad und das Einkommen fast aller Surfer abschätzen. Hinzu kommen die hier nicht dargestellten Interessen, politische Orientierung und Kontaktadressen (E-Mail, Instant-Messaging), die Google ebenfalls einsammelt. Wie das Wall Street Journal in einer Analyse beschreibt, kann auch die Wahrscheinlichkeit einer Kreditrückzahlung eingeschätzt werden. Die Forscher Bin Cheng und Paul Francis vom Max Planck Institute for Software Systems zeigen, dass man anhand der Klicks auf Werbung homosexuelle Männer erkennen kann. Das Verfahren kann an beliebige Fragestellungen angepasst und u.a. für individualisierte Werbung genutzt werden.

Besonders gut lässt sich die Verfolgung und Beobachtung von Surfern beim Re-Targeting erkennen. Wer beim Besuch eines Webshops nichts gekauft hat, wird in der Folgezeit mit Werbung zu ähnlichen Produkten überschüttet. Google bietet ein spezielles AdSense-Programm mit Re-Targeting.

RapLeaf

Die Firma RapLeaf sammelt Datenprofile anhand von E-Mail-Adressen. Die Daten werden nicht für personalisierte Werbung verwendet, sondern einfach verkauft. Als Interessent übermittelt man eine Liste von E-Mail-Adressen an RapLeaf und erhält nach Bezahlung der Rechnung die Profile im gewünschten Umfang. Kurzer Auszug aus der Preisliste (Stand 2011):

  • Alter, Geschlecht und Ort: 0 Cent (Lockangebot)
  • Haushaltseinkommen: 1 Cent pro E-Mail-Adresse
  • Ehestand: 1 Cent pro E-Mail-Adresse
  • vorhandene Kinder: 1 Cent pro E-Mail-Adresse
  • Wert des bewohnten Hauses: 1 Cent pro E-Mail-Adresse
  • Relation von Krediten zum Vermögen: 1 Cent pro E-Mail-Adresse
  • vorhandene Kreditkarten: 1 Cent pro E-Mail-Adresse
  • Fahrzeuge im Haushalt: 1 Cent pro E-Mail-Adresse
  • Smartphone Nutzung: 3 Cent pro E-Mail-Adresse
  • Beruf und Ausbildung: 2 Cent pro E-Mail-Adresse
  • Tätigkeit als Blogger: 3 Cent pro E-Mail-Adresse
  • wohltätige Spenden: 3 Cent pro E-Mail-Adresse
  • Präferenzen für hochwertige Marken: 3 Cent pro E-Mail-Adresse
  • Präferenzen für Bücher oder Zeitschriften: 3 Cent pro E-Mail-Adresse
  • ...

Die Daten werden durch Korrelation von E-Mail-Nutzung und Surfverhalten gewonnen und bei den immer wieder auftretenden Datenlecks der Online-Händler abgegriffen. Zu den Hauptinvestoren bei RapLeaf gehört Peter Thiel, der PayPal gründete und im Hintergrund maßgeblich die Entwicklung von Facebook mitbestimmt. Es ist davon auszugehen, dass RapLeaf auch Datensammlungen dieser Internetfirmen verarbeitet. Außerdem fließen die Twitter-Daten in die Auswertung ein und weitere Datenbanken, die kommerziellen Zugriff bieten.

Facebook

Wirtschaftliche Zahlen: Das "soziale Netz" Facebook soll 600 Millionen Nutzer weltweit haben. Der Börsenwert des Unternehmens wird auf 50 Milliarden Dollar geschätzt und der erwirtschaftete Gewinn lag 2010 bei 353 Millionen Dollar. Die Einnahmen betragen etwa 4-5 Dollar pro Nutzer und Jahr. (Stand 2011)

Auch Facebook ist kostenfrei nutzbar und die Daten der Nutzer bilden die Grundlage für den kommerziellen Erfolg. Es geht dabei nur zu einem geringen Teil um Daten, welche die Nutzer bewusst und kontrolliert eingeben. Wesentlicher sind die aus dem Verhalten der Nutzer extrahierten Informationen. Über diese Daten und die daraus abgeleiteten Informationen haben die Nutzer keine Kontrolle. Einer kommerziellen Verwertung haben alle Nutzer bei der Anmeldung zugestimmt.

  • Freundes-Beziehungen

    Die Kontaktbeziehungen der Nutzer werden nach verschiedenen Zielen ausgewertet. In erster Linie werden sie für Friend-2-Friend Werbung genutzt. Viele Nutzer sind sich nicht im Klaren, dass sie als Werbeträger dienen. Verbessert wird die gezielte Werbung durch Indentifikation von Meinungsmachern in Kontaktnetzwerken, die als Multiplikatoren angesprochen werden (z.B. um Sponsored Stories zu veröffentlichen).

    Eine weitere Form der Auswertung der Kontakte demonstriert Gaydar - die Schwulen-Radarfalle. MIT-Studenten analysierten anhand der Kontakte aus den Facebook-Profilen die sexuellen Neigungen der Account-Inhaber. Solche Informationen könnten eine Karriere beeinflussen.

  • Auswertung des Spielverhaltens

    Facebook bietet für Mitglieder verschiedene Spiele, wie "Farmville" oder "Mafia Wars". Die Spielzüge der Teilnehmer werden ausgewertet und Charaktereigenschaften abgeleitet. Diese Profile werden kommerziell verwertet. Unternehmen können die Charakterprofile potenzieller Bewerber kaufen.

  • Gesichtserkennung

    Das Veröffentlichen privater Fotos gehört zu den beliebtesten Aktivitäten bei Facebook. Inzwischen wird eine Software zur Gesichtserkennung eingesetzt. Es werden laut Facebook täglich einige Millionen Personen auf den hochgeladenen Fotos identifiziert. Dabei werden nicht nur Mitglieder von Facebook identifiziert, sondern alle Personen auf den Fotos.

    Damit entsteht eine riesige Datenbank, die kommerziell genutzt werden soll. Zukünftig könnten Verbraucher beim Betreten eines Geschäftes von einer Kamera identifiziert werden und der Verkäufer könnte ein umfangreiches Persönlichkeitsprofil abrufen (gegen Entgeld). Im Rahmen der Next Generation Identification des FBI könnte Facebook für das Sammeln biometrischer Gesichtsbilder zum Füllen der FBI-Datenbank genutzt werden.

    "Mit 14 Fotos können wir jede beliebige Person identifizieren. Sie glauben, im Netz findet man keine 14 Fotos von Ihnen? Es gibt doch Facebook!" sagte Eric Schmidt (damals CEO von Google) auf der Techonomy-Konferenz am 4. August 2010.

  • Geheimdienste, Armee und Strafverfolger

    Auch Behörden und Geheimdienste nutzen die Informationen bei Facebook und schnüffeln in der Privatsphäre der Nutzer. Das israelische Militär durchforstet die Facebook-Profile von Wehrdienstverweigerern. Die Aktivisten der Protestaktion "Willkommen in Palästina" wurden von Isreal auf Facebook identifiziert und mit Einreiseverbot belegt. Andere Geheimdienste gehen aggressiver vor. Die Agence Tunisienne d'Internet (ATI) nutzte "Javascript Injection Attacks", um an die Login-Daten von verdächtigen Aktivisten zu kommen. Die Profile wurden dann übernommen und nach Beweismitteln durchsucht. Die Folge waren Verhaftungen auf Basis dieser Daten.

  • Datenschutzbestimmungen

    "Mir sind keine Datenschutzbestimmungen von Facebook bekannt, die diesen Namen verdienen. Es handelt sich um Nutzungsregelungen, die grob nach dem Muster ablaufen: Du Nutzer bist für alles verantwortlich, was Du bei uns machst. Und wir dürfen mit den Daten dann alles machen, was uns gefällt." (Dr. Thilo Weichert, Datenschutzbeauftragter von Schleswig-Holstein)

Facebook wird zu einem "Netz im Netz" mit orwellschen Visionen.

Twitter

Wirtschaftliche Zahlen: Twitter hat eine geschätzte Nutzerzahl von 200 Millionen. Jeder Nutzer verursacht Kosten von ca. 1 Dollar pro Jahr. (Stand 2010)

Im Gegensatz zu Google und Facebook hat es Twitter nicht geschafft, die Daten selbst gewinnbringend zu nutzen. Die Einnahmen aus der Werbung bleiben deutlich unter den Erwartungen.

Das Geschätsmodell von Twitter ist der Verkauf des Zugriffs auf die Datenbank. Zu jedem Tweet stellt Twitter 40 Parameter bereit (Inhalt, Ort, Zeitpunkt, Account, genutzte Software, Sprache, Retweets...). Für 60.000 Dollar im Jahr kann man auf 5 Prozent der Tweets zugreifen, für 360.000 Dollar gibt es den Zugriff auf die gesamte Datenbank. Für Marktforschung, Werbung und Geheimdienste ist die Twitterdatenbank eine Fundgrube von Informationen, die sonst nicht zu haben sind.

<- WWW-Privatsphäre Inhalt Techniken der Datensammler ->

 

Download

Stabile Version
00.20.001


Beta-Version
00.20.010


InfoService

Status der verfügbaren AN.ON-Dienste und Informationen über diese.


Aktuell / News

Einschränkungen bei den Dresden (JAP) Anonymiserungsservern
Nach reiflicher Überlegung haben wir uns entschlossen, die Downloadmöglichkeiten über die Dresden (JAP) Mixe etwas zu beschränken, um eine fairere Nutzung der knappen Ressourcen unserer Server für alle Nutzer zu ermöglichen, die einfach "normal" im Web surfen wollen. mehr...

 
---