Deus ex Machina

Deus ex Machina

Über Gott und die WWWelt

Von Big Data zu Big Brother?

| 7 Lesermeinungen

Bei Twitter, Facebook und anderen Internet-Diensten fallen gigantische Datenmengen an. Die systematische Beschäftigung mit diesem Nebenprodukt könnte einige Forschungsbereiche revolutionieren.

Ob die Zahl wirklich stimmt, wird sich kaum überprüfen lassen, aber auf alle Fälle klingt es ziemlich gigantastisch, wieviel Datenvolumen die Menschheit Tag für Tag erzeugt: Schätzungen von IBM zufolge fallen täglich 2,5 Trillionen (also 2.500.000.000.000.000.000) Bytes an. Darin sind die Messdaten einer abgelegenen Wetterstation ebenso enthalten wie die vielen Katzenbilder, die irgendwo im Netz hochgeladen werden oder die Zilliarden an abgesetzten Twitter-Meldungen rund um den Globus. Und natürlich liefert diese Überfülle an Daten einen wertvollen Rohstoff für weitergehende Analysen und Auswertungen. Der Sozialforscher und Social-Media-Experte Benedikt Köhler sieht Big Data – also den Umgang mit sehr großen Datenmengen – in den kommenden Jahren ganz oben auf der Agenda der Markt- und Sozialforschung.

Die Euphorie ist verständlich. Denn obwohl das Datenvolumen enorm gewachsen ist, hat sich die Erhebung und Verarbeitung dieser Datenmengen im Vergleich zu früher enorm vereinfacht: „Heute kann ein Student mit Hilfe von Amazon-Cloudcomputing die APIs von Social Networks wie Facebook, Twitter, Foursquare etc. anzapfen, und binnen weniger Tage liegen in seiner Datenbank mehr Sozial- und Verhaltensdaten als die gesamte Markt- und Sozialforschung während der 50er und 60er Jahren erhoben hat”, schreibt Köhler in seinem Blog „Viralmythen”. Das eigentlich Neue bei Big Data ist aber nicht allein das Volumen oder die schiere Größe – hinzu kommt die enorme Geschwindigkeit, denn diese riesigen Datenmengen fallen auch noch recht schnell an, häufig sogar in Echtzeit. Und der dritte markante Punkt ist die Unordnung beziehungsweise Unstrukturiertheit, in der diese Datenmengen oft anfallen. Der klassische sozioempirische Dreiklang aus Datenerhebung, Datenbereinigung und Auswertung lässt sich daher nicht mehr spielen wie gewohnt, Big Data erfordert andere Ansätze, Fertigkeiten und Werkzeuge als bisher.

Bild zu: Von Big Data zu Big Brother?

Die großen Datenmengen versprechen aber nicht nur neue Erkenntnisse, sondern auch ganz realen Mehrwert. Entsprechend ruft Big Data auch neue Geschäftsmodelle und Dienstleistungen auf den Plan. Ein wenig erinnern die Schlagworte und Versprechungen an die späten neunziger Jahre, als die IT-Branche noch Lösungen für sogenanntes Data Warehousing und Analyseprogramme für Data Mining anpries. Im Einzelhandel versprach der Einsatz von Scannerkassen und entsprechenden Analysetools in den Warenwirtschaftssystemen völlig neue Einsichten in das Kaufverhalten der Kunden. Per Warenkorb- und Bondatenanalyse kam die US-Handelskette Walmart angeblich dahinter, dass Freitag abends oft Windeln zusammen mit Bier-Sechserpacks gekauft wurden, und mit entsprechender Neugruppierung dieser Warengruppen in den Filialen soll der Handelsriese den kombinierten Absatz von Bier und Windeln nochmals signifikant gesteigert haben. Zwar ist dieses bekannte Beispiel längst als urbaner Mythos entlarvt, aber der Überzeugung, dass in den ohnehin anfallenden Daten ungehobene Schätze an businessrelevanten Informationen schlummern, tut dies bis heute keinen Abbruch.

Damals wie heute liegt die Haupt-Triebfeder der Erkenntnis nicht unbedingt darin, zu erfahren, wie das Publikum tickt – sondern eher darin, datengestützt die Treffgenauigkeit und Wirksamkeit von konsumstimulierenden Impulsen zu steigern und gleichzeitig werbliche Fehlstreuungen zu vermeiden. Der Online-Händler Amazon hat Anfang Dezember ein Patent eingereicht, wie Nutzer anhand ihres Mobiltelefons getrackt werden können und aus den individuellen Bewegungsdaten Prognosen abgeleitet werden, welche Kaufhäuser und Läden der Nutzer in naher Zukunft besuchen wird. Entsprechend können diese Läden den Nutzer dann mit speziellen Werbebotschaften ansprechen oder ihn mit Gutscheinen locken.

Bild zu: Von Big Data zu Big Brother?

Und das ist noch eine der harmloseren Implikationen der Big-Data-Thematik. Mit stetig sinkenden Speicherkosten für personenbezogene Daten jedweder Art wachsen auch die Begehrlichkeiten und Möglichkeiten der Überwachung. Von Big Data zu Big Brother ist es womöglich nur ein kurzer Weg, warnt Professor John Villaseno von der University of California Los Angeles (UCLA): „Mit den umfangreichen Datensammlungen kann man heutzutage eine Überwachungs-Zeitmaschine bauen.” Wenn Behörden eines autoritären Regimes einen Demonstranten oder Regimegegner festnähmen, könnten sie weit rückwirkend Telefongespräche und Verbindungsdaten sowie Bewegungsprofile und Sozialkontakte dieser Person rekonstruieren. „Das alles verändert nachhaltig die Dynamik von Protesten, Aufständen und Revolutionen”, schreibt Professor Villaseno in seinem Report „Reporting Everything: Digital Storage as an Enabler of Authoritaritan Government”. Damit ist aber auch klar: Die Analysewerkzeuge sind nicht per se bösartig. Die Technologie dahinter kann man ebenso zur besseren Kundensegmentierung im mobilen E-Commerce nutzen wie zur Erkennung und Überwachung von potenziellen Regimekritikern. Es ist die konkrete Anwendung, die den Unterschied macht.

Die Privatwirtschaft betrachtet Big Data überwiegend als Chance: etwa zur Absatzsteigerung und Vermeidung von Streuverlusten in der Werbung, aber auch zur Angebotsoptimierung in der Versicherungsbranche und zeitnäherer Beobachtung von Marktschwankungen in der Finanzwirtschaft. Aber die schiere Größe des Datenvolumens ist auch kein Wert an sich, sagt Danah Boyd, Marktforscherin in Diensten von Microsoft in Redmond. Zumindest keiner, der die gelernten Methoden der Sozioempirie völlig obsolet macht. So reizvoll und aufschlussreich es zum Beispiel ist, Twitter-Nachrichten zu analysieren, muss sich der Forscher vor Augen halten, dass Twitter-Nutzer nicht repräsentativ sind für die Gesamtbevölkerung und dass über die Gesamtheit der Twitterati auch nur vage Aussagen möglich sind. Hinter manchem Account stehen mehrere Personen, und bisweilen pflegen Einzelpersonen auch mehrere Accounts. Noch mehr Vorsicht ist geboten beim Zusammenführen von Daten aus mehren Quellen: Jede Quelle hat ihre spezifischen Fehlerquellen, und in der Kombination können sich die Fehlerquoten multiplizieren. Das Hauptaugenmerkt sollte also nicht auf der Größe der Stichprobe liegen, sondern auf ihrer Qualität, mahnt die Microsoft-Marktforscherin: „Die Big-Data-Ära hat gerade erst begonnen, aber es ist unerlässlich, dass wir die Grundannahmen, Werte und blinden Flecken dieses Forschungsansatzes kritisch hinterfragen.”


7 Lesermeinungen

  1. David Hilbert hat zum...
    David Hilbert hat zum Abschluss eines Radio-Interviews, in den 1920ern, einmal gesagt: “Wir müssen wissen, und Wir werden wissen!”. Damit hat er instinktiv oder auch empirisch begründet, benannt, was als eine der Triebkräfte des DaSeins längst allgemein bekannt sein sollte: der ungezügelte Wissensdurst und die genauso ungebändigte Entfaltungslust der Lebendigkeit. Lebendigkeit ist ein ausgreifender Mangelzustand, das hat Gründe. Welche, das sind Wir dabei herauszufinden. Jetzt ist auch langsam klar, warum fast Alle Menschen bereit sind, mehr und mehr aus und von sich preiszugeben und immer grössere Sammelstellen entstehen, um diese Informationen zu lagern, zu ordnen, zu interpretieren und zu verwerten. Wie Sie schreiben, geht das in jede Richtung, also sowohl zu den Ungunsten von Einzelnen, Gruppen oder sogar dem Ganzen, oder auch zu Aller Nutzen. Letzlich aber zum Nutzen und zur Befried-ung/igung des DaSeins, aber das ist noch WEIT vorausgeahnt, oder? Danke für den Beitrag.

  2. @Oliver-August Lützenich:...
    @Oliver-August Lützenich: Danke für Ihren Kommentar. Tatsächlich war ich unmittelbar nach dem Abschicken dieses Beitrags etwas unsicher, ob ich nicht zu sehr dem gepflegten Sowohl-als-auch das Wort rede, wo ich eigentlich hätte klarer Position beziehen sollen, mich also für “Hosianna!” oder “Kreuzige ihn!” zu entscheiden, wie man in unseren Kreisen so sagt. Und doch, es geht wie Sie richtig sagen gleichzeitig in verschiedene Richtungen, je nach dem, worauf man sich gerade fokussiert. Die Sammelei und Mustersucherei in den großen Datenmengen ist per se nicht verwerflich, aber dass wir so vieles teilen können, garantiert halt auch nicht unbedingt für eine bessere Welt. Es besteht immer die Dualität von Chance und Risiko, und ich sehe meine Aufgabe nicht zuletzt darin, das Bewusstsein dafür wachzukitzeln, dass das eine ohne das andere wohl nicht zu haben ist hienieden.

  3. @Marco Settembrini di Novetre:...
    @Marco Settembrini di Novetre: Bisher, wie Sie es auch schildern, geht das “Licht” der Aufklärung nur in eine Richtung, von gesellschaftlichen oder wirtschaftlichen Organisationen (Staat, Behörden, Firmen) aus, auf und in die Mehrheit hinein. Es folgt einem hierarchischen Prinzip: von der Spitze in die Breite “hinunter”, besser: hinein. Die Spitzen sind dabei austauschbar und wechseln auch beständig, die Richtung bleibt. Der Staat oder die Firmen beobachten und sammeln, lassen aber meist keine Einblicke von der beobachteten Seite aus zu. Es ist bisher eine Einbahnstrasse. Wie geschrieben, das “Licht” geht von “Oben” aus, nach “Unten”. Ich werde von Firmen und Behörden eingesammelt, geordnet, untersucht und verwertet, mir wird jedoch verwehrt, dasselbe mit den Behörden und Firmen zu tun. Ich würde gerne Kameras in den Observierungs-einrichtungen von Staat und Firmen einrichten, also bei Bahn, Einkaufszentren, Polizei, Sicherheitsfirmen u.s.w., die ich im Internet auch anklicken kann, um zu beobachten, was dort so gesehen und aufgezeichnet wird, und ich hätte gerne den vollen Zugriff auf alle Datenbanken, in denen ich geführt werde. Ich hätte es also gerne, dass das “Licht” auch in die andere Richtung zurückstrahlt. Wenn der Präsident mich beim Pinkeln beobachten kann, dann möchte ich auch den Präsidenten beim Scheissen beobachten können.
    Gleichstand.
    Aber, wie Sie schildern, verweigern Wir Uns noch dieser Transparenz und lassen die Heimlichtuerei und Wichtigtuerei der Wenigen geschehen. W i r tun das, ja, weil, wenn Wir das in der Mehrheit nicht mehr dulden, ist diese einseitige Fleischbeschau sehr schnell vorbei. Dann installiere ich, bei mir, in allen Räumen Kameras und Mikrophone und Alle Anderen, auch alle Behörden und Firmen, tun das auch. Wenn ich dann Lust darauf bin, dem Soundso beim frühstücken oder auch beim !?! zuzusehen, dann tue ich das, Er/Sie kann das dann bei mir auch. Das verstehe ich als Inhalt des Begriffs Transparenz. Aber, wie Sie in sich bereits fühlen, wollen Wir das noch nicht, können Wir das noch nicht, deshalb geht das “Licht” wahrscheinlich noch längere Zeit nur in die eine Richtung. Wir sind zum wieder-spiegeln noch nicht bereit. Wir fordern zwar Transparenz, aber fast immer nur von Anderen; das Licht geht nur von Uns aus, wenn es Uns trifft, steigt die Scham und die Abwehr. Völlig natürlich; ich beobachte auch gerne Andere, aber wenn ich beobachtet werde, steigt der Schampegel sofort. Ich denke, da bin ich nicht allein. Allerdings fühle ich die Bereitschaft, die Scham fallen zu lassen, wenn Alle anderen auch bereit sind die Schranken fallen zu lassen, wenn Wir alle in der Lage sind, einander zu beleuchten und zurückzustrahlen. Aber das dauert noch, ich spüre es gerade wieder, die Scham bei der Vorstellung, dass mich, wer möchte, bei Allem beobachtet und hört. Da hilft auch nicht die Idee, dass ich das dann auch bei Allen tun könnte. Ziemlich versponnen, das.
    Gleichstand?
    Aber die Tendenz zur wechselseitigen Aufklärung und Beleuchtung ist unzweifelhaft vorhanden, Sie sind einer dieser “Zweifelhaften”, die “wachkitzeln” wollen, und eine allzugrosse Einseitigkeit abbauen möchten, meine Unterstützung haben Sie bereits.
    Da Heute auch Jahresende ist, wünsche ich Ihnen und Allen Lesern Ihres Blogs einen “Guten Rutsch!”, kommen Sie gut und Unfallfrei ins neue Jahr, dort schreiben Wir einander wieder. Guten Abend.

  4. tricky1 sagt:

    "Wenn Behörden eines...
    “Wenn Behörden eines autoritären Regimes einen Demonstranten oder Regimegegner festnähmen…”
    .
    Nicht nur Behörden autoritärer Regimes bedienen sich zunehmend solcher Möglichkeiten, oder sind in Westeuropa jetzt derart viele Regimes als autoritär zu bezeichnen??

  5. @tricky1: Das nicht unbedingt,...
    @tricky1: Das nicht unbedingt, aber wie es im oben angeführten Titel des Aufsatzes von Prof. Villaseno heißt, ist die Speicherei ein “Enabler” autoritärer Regimes. Ich denke, das darf man schon als Warnung verstehen, dass staatlicher Datensammeleifer eher autoritäre Tendenzen im politischen System verstärken dürfte.

  6. @Marco:
    Muss an meinem Hobby...

    @Marco:
    Muss an meinem Hobby Geschichte liegen – aber eigentlich bin ich versucht, “wie immer” auszurufen :-). Wie immer birgt eine neue Technik Chancen wie Gefahren. Wobei Sie mir die Chancen sogar erheblich zu sehr ökonomisch beschrieben haben. Auch die Sozialforschung könnte erheblich von verfügbaren Echtzeit-Daten profitieren, mit der üblichen biologisch bedingten Verzögerung dann auch die Politik.
    Auch wenn Sie auf die Gefahr der Fehlerquellen bereits hingewiesen haben, dazu noch zwei Gedanken:
    1) Neben der gruppenspezifischen Verzerrung gibt es eine weitere, zu selten beachtete. Jede Datenbank enthält Fehler MINDESTENS im Ausmass der menschlichen Fehlerquote, die auch bei konzentriertem Arbeiten bei +/- 2% anzusiedeln ist, erheblich mehr, wenn´s nicht wirklich wichtig erscheint. Die Kombination verschiedener Datenquellen kann diese Fehlerquote sogar über die reine Addition hinaus erheblich steigern.
    2) Die sinnvolle Analyse von Daten setzt fast immer eine Theorie über Wirkungszusammenhänge voraus, andernfalls verwechselt man Korrelation mit Konsequenz. Während sich aber unser Wissen in Form von Rohdaten exponentiell vermehrt, ist das mit den Wirkungszusammenhängen keineswegs der Fall. Fast schon im Gegenteil – viele in allgemein zugänglichen Quellen wie Tageszeitungen berichtete Studienergebnisse erneuern nur triviales Wissen über den Menschen, das in der Generation meiner Eltern noch selbstverständliches Allgemeingut war. Die (echte?) Überraschung der Journalisten zeigt mir, wie sehr der generationenübergreifende Wissenstransfer gelitten hat, seitdem das Wissen von Alten unter dem Generalverdacht steht, mit dem Entwicklungstempo der Moderne obsolet zu werden. Dabei entwickelt sich die gesellschaft – grundsätzlich unbd als ganzes betrachtet – nach wie vor im Schneckentempo …
    Gruss im hoffentlich produktiven neuen Jahr,
    Thorsten Haupts

  7. @ThorHa: Ja, das Entscheidende...
    @ThorHa: Ja, das Entscheidende dabei sind (wie bisher auch) nicht die Daten, sondern die Rückschlüsse, die man daraus zieht. Ich kann dazu das Paper “Six Provocations for Big Data” von Danah Boyd nur wärmstens empfehlen (hier ein Link zum Download des PDFs):
    https://papers.ssrn.com/sol3/papers.cfm?abstract_id=1926431
    Hatte es im Ursprungsbeitrag nicht verlinkt, weil die Website ein paar Tage lang wartungsbedingt down war und ich die Leser nicht auf die Route 404 schicken wollte.
    .
    Mit dem uralten Menschheitswissen, das Eltern angeblich noch zu Gebote stand, ist das so eine Sache. Wenn das alles so einfach wäre und wir es nahezu ausschließlich mit anthroposophischen Konstanten zu tun hätten, dann müßte ich zu allem und jedem ja immer nur meine Oma fragen (jetzt, wo Jopi Heesters nicht mehr unter uns weilt). Die Kunst besteht meines Erachtens aber vielmehr darin zu erkennen, was die gleichbleibenden Faktoren und Vektoren sind und wo im Unterschied dazu tatsächlich gesellschaftlicher Wandel stattfindet.
    .
    Ansonsten ist die Wiedergabe von Studienergebnissen in der Tagespresse auch nicht unbedingt repräsentativ für das, was in der Markt- und Sozialforschung talk of the town ist. Hinzu komt das mediale Selbstverständnis “news is what’s different”, auf Grund dessen die Medien es auch weniger als ihre Aufgabe betrachten, das zu referieren, was schon immer so gewesen ist, sondern das, was neu und noch nie dagewesen erscheint.
    .
    Ansonsten mögen Sie auch recht haben damit, dass ich mich hier bei den Chancen zu sehr aufs Ökonomische kapriziert habe (überhaupt kommt es mir so vor, als hätte ich das Thema “Big Data” hier nur oberflächlich angerissen) – aber tatsächlich sehe ich neben dem staatlichen Datensammeldrang die Wirtschaft als zweiten großen (wenn nicht den den größten) Treiber der Entwicklung. Dass sich aus den immer größer werdenden Datenpools auch diverse gesellschaftlich relevanten Insights ergeben können, bei denen nicht gleich die ökonomische Verwertbarkeit im Fokus steht, mag schon sein. Aber das sind dann mehr so die dekorativen Streusel auf der Sahnetorte.

Kommentare sind deaktiviert.