Mastodon Skip to main content

Ist Big Data auch neutrale Data?

By 12. Februar 2013Internet der Dinge

Wenn man das große Potenzial von Big Data sowie die Tatsache, dass diese Daten sowohl positiv als auch negativ verwendet werden können, in Betracht zieht, lässt es sich vermuten, dass Big Data per se neutral sein sollte.

Das war eine ähnliche Aussage aus einem Podcast (von @breitband), die am Wochenende eine rege Diskussion angestoßen hat. Jedoch behaupte ich, dass Big Data einiges sein kann, nur nicht neutral.

BIG? data.

Kurz zusammengefasst: mit Big Data sind große Datenmengen gemeint, deren Erfassung, Speicherung, Suche, Verteilung, Analyse und Visualisierung spezielle Methoden voraussetzen. Big Data wird dann verwendet, um Mustern (bzw. Anomalien) zu erkennen.

Weiterhin, Big Data ist zur Zeit ein Trend in Marketing und weiteren Geschäftsbereichen. Diese Unmengen an Daten werden aus verschiedenen Quellen wie Social Media, Online-Shopping, Finanztransaktionen, gelesene Nachrichten und Artikeln, Mobiltelefonen usw. gesammelt. Die gesammelten Daten werden dann ausgewertet und, natürlich, verkauft.

Vieles wurde bereits über die Nutzung von Big Data und dessen ethische Aspekte geschrieben. An dieser Stelle empfehle ich zwei Artikel von Evgeny Morozov und Danah Boyd als Beispiel.

(Nicht wirklich) neutrale Data

Der zugrunde liegenden Behauptung über die Neutralität von Daten (anders als Information), nämlich dass eine Sammlung von Zeichen bzw. 0 und 1 auf verschiedene Arten und Weisen verwendet werden können, kann ich nur zum Teil zustimmen, weil in der Praxis die Sache etwas komplizierter ist.

Der Komplexitätsgrad Daten→Information→Wissen steht in umgekehrte Relation zur “Neutralität”. Dies allerdings, bedeutet nicht, dass Daten neutral sind.
Die Informationsphilosophie hat bereits die Annahme, dass Informations- und Kommunikationstechnologie (u.a. Algorithmen und Online-Plattformen) neutral seien, annulliert. Das heißt, technologische Gegenstände (technological artifact) können für verschiedene Zwecke verwendet werden, positive wie auch negative, aber sie haben einen werte-geladene (value-laden) Charakter durch ihr Design (und die Sozialisation der verwendenden Person). Dieser werte-geladene Charakter begünstigt bestimmte Verwendungen des Gegenstandes und verhindert andere.
Dies ist für die Algorithmen, die Daten auswerten, und deren Anwendung zutreffend.

Aber dies gilt auch für die Daten selbst. Und das möchte ich zu erklären versuchen:
Eine willkürliche Sammlung von ‘0’ und ‘1’ dürfte eventuell neutral sein. Big Data allerdings (oder die meisten künstlich erzeugten und gesammelten Daten was das betrifft), ist keine willkürliche Sammlung von Bits. Das sind ganz bestimmte Arten von Daten, die durch gewisse Praktiken gesammelt wurden, in bestimmten Strukturen abgelegt wurden und all das für bestimmte Zwecke:

  • Big Data sind ganz bestimmte Arten von Daten: hauptsächlich persönliche und personenbezogenen Daten aber auch allgemeine Daten über Gewohnheiten, Verhalten, Ortsangaben usw. von Menschen.
  • Big Data wird durch gewisse Praktiken gesammelt: Harvesting, Zählpixel, Cookies, Verkauf und Ankauf an/durch Dritte, Mobiltelefone u.v.m.
    Sie können Ghostry installieren, um einen Einblick darin zu gewinnen, wer Sie überall im Internet verfolgt.
  • Strukturen: auch bevor man Algorithmen verwendet, um die Daten auszuwerten, werden diese in bestimmten Strukturen und Verlinkungen abgelegt. Diese Strukturen dienen natürlich den Zwecke derjenigen, die diese Daten sammeln. Und allein diese Strukturen können bestimmte Verwendungen der Daten begünstigen oder verhindern.
  • Intentionen: wie bereits erwähnt, all diese Daten dienen den Zwecken derjenigen, die sie sammeln und analysieren. Das heißt, die Daten werden mit gewissen Intentionen/Interessen gesammelt, sodass diese Intentionen wiederum einen Einfluss auf den Inhalt (Art) der Daten, auf ihre Strukturen und auf die Sammlungspraktiken haben.
    Diese Intentionen können, z.B., wirtschaftliche oder politische Interessen sein.

Diese Aspekte sind alles andere als neutral, auch wenn man mit einer Sammlung von Bits zu tun hat.

 

Eine Ausführliche (englischsprachige) Fassung dieses Artikels wurde auf dem Drawer 2.0 Blog veröffentlicht.