Home
Digital Twin

Digital Twin

Das Netzweltblog

Die Wirklichkeit der Metadaten

Daten sagen weder die Wahrheit, noch lügen sie. Im Big-Data-Zeitalter wird aus ihnen allerdings immer häufiger soziale Wirklichkeit abgeleitet. Sozialforschungen dazu gibt es nicht.

© APDer Vize und sein Präsident. Als Amtsanwärter haben Joe Biden und Barack Obama die Metadatenanalysen der Telefonüberwachung verteufelt. Im Amt loben sie die Verheißungen dieser angeblich rechtskonformen Ermittlungsarbeit. Wer lügt, lässt sich dennoch nicht so einfach sagen.

Der Begriff ist in der Tat ein Mysterium. Was soll ein Metadatum schon sein? Gerade das Big-Data-Zeitalter lehrt doch, dass alle Daten per se gleichwertig sind, bis Analysen zeigen, was sie unterscheidet, was sie wichtig oder unbedeutend macht, welchem Kontext sie zuzuordnen sind oder als wie neutral und wahrhaftig sie gelten können.

Nun beförderte ausgerechnet der Spähskandal, also die Offenbarung der allgegenwärtigen und allwissenden Big-Data-Prozesse, den Begriff Metadaten in die Diskussion – ohne ihn zu differenzieren, obwohl er eigentlich sogar entmystifiziert werde sollte. Kein Wunder, dass Journalisten davon fasziniert sind. Begriff und Bedeutung von „Metadaten“ sind in der Tat erklärungsbedürftig.

Entsprechend doppelsinnig betitelte das SZ-Feuilleton vergangenen Mittwoch einen Erklärungsversuch von Michael Moorstedt. Es gehe um „die Lüge von den Metadaten“, versprach die Überschrift. Wobei die Lügner tatsächlich die Politiker seien, die verschwiegen, wie wahr sei, wovon Metadaten berichten können.

Mit Verweis auf Metadaten habe Obama vor der amerikanischen Öffentlichkeit behaupten können, dass niemand „ihre Telefongespräche“ abhöre. Diesen Bezug auf Inhalte bräuchte man gar nicht, um zu verstehen, worum es geht, lautete sofort das Gegenargument. Im Grunde reicht es, allein Barack Obama und Joe Biden zuzuhören, um den damit beschriebenen Widerspruch zu verstehen. Die Wahrheit über Metadaten verändert sich, je nachdem, ob man als Präsident oder Anwärter über sie spricht.

Zur Entmystifizierung trägt Moorstedts anschließende Analyse dann jedoch kaum bei. Denn wenn er auch behauptet, die neueren, beschwichtigenden Aussagen von Präsident und Stellvertreter mit dem „Abschlussbericht“ einer Studie über Metadaten des „renommierten IT-Sicherheitsforschers Jonathan Mayer“ widerlegen zu können, so handelt es sich tatsächlich nur um die Erkenntnisse eines Doktoranden, der sie in einem Blogartikel, kaum länger als der journalistische Text darüber, niederschrieb.

Wenn Mayer die akademische Reputation auch fehlt, prominent ist er. Und Beachtung verdient er allemal. Allerdings nicht, weil er eine wichtige Studie geschrieben hat, sondern weil er diese Wissenschaft so betreibt, wie sie der Allgemeinheit auch nützt: Die Erkenntnisse seiner Metastudien-Untersuchung publiziert er auf seinem Blog Schritt für Schritt.

Seit November haben sich mehr als 500 Menschen Mayers „MetaPhone“-App auf ihr Telefon geladen. Sie alle wurden Versuchskaninchen in Mayers Simulation der NSA. Die erste große inhaltliche Sensation des Experiments ist tatsächlich, wie lückenlos sich Menschenleben überwachen lassen, wenn man Personen dazu überredet, sich eine einfache App auf ihr Telefon zu laden.

Die eigentliche Frage, die auf die inhaltlichen Ausforschungen folgt, ist dann tatsächlich, was Metadaten bedeuten. Die Ambivalenz dieser Unentschiedenheit entfaltet sich allerdings nicht in der Unterscheidung von Wahrheit und Lüge. So ließe es sich aus Mayers Arbeit auch nicht herauslesen.

Die interessante Frage ist nicht, ob Metadaten die Wahrheit sagen, sondern durch welche Mechanismen dem, was Metadaten sagen, faktische Geltung und normative Kraft zugesprochen werden. Einen dieser Mechanismen kennen wir inzwischen dank Edward Snowden: Das britische GCHQ fälscht Daten, um Karrieren und Kontakte zu sabotieren.

Noch gänzlich unverstanden ist aber, wie zwar gefilterte aber nicht gefälschte Erkenntnisse geheimdienstlicher Spähpraxis zur Handlungsgrundlage polizeilicher Ein- und Übergriffe werden.

Dieser Film, der einen Monat vor den ersten Snowden-Enthüllungen auf Youtube geladen wurde, befasst sich mit dem noch lange interessanten Fall des Berliner Soziologen Andrej Holm. Die Wortwahl in einem Text bescherte ihm Untersuchungshaft und Komplettüberwachung seiner Familie über Monate. Rückblickend ein systemisches Versagen, aber niemand hat gelogen, kein Ermittler, keine Metadaten.

Per Metadatenanalyse lässt sich, wie Mayer vermutet, recht sicher sagen, wer schwanger ist – abgeleitet allein aus Telefonkontakten und Einkaufsverhalten. Tatsächlich geht es aber um weit Folgenreicheres, bei viel kleinerer Datenbasis: Wer im Sommer mit Jacke in eine U-Bahn-Station geht und dort einen Zug wegfahren lässt, gilt als verdächtig. Wahrscheinlich hat der Computer per deep-learning selbst herausgefunden, dass gerade dieses Verhalten eine Abweichung bedeutet.

Auf private Google-Suchen nach Kochtöpfen und Rücksäcken folgten nach dem Bombenanschlag in Boston beim Marathon 2013 Verhaftungen. Schon zuvor durchsuchten staatliche Stellen das Netz nach dieser Art verdächtiger Zusammenhänge. Nach dem echten Bombenterror wurden den Maschinen offenbar Weisungsbefugnisse zugesprochen. Die Polizei führte aus, was die Maschinen vorgaben – anschließend wurde von Menschen ermittelt, was Sache war. Auch diese Metadatenanalysen logen nicht, sie sagten allerdings auch nicht die Wahrheit. Sie funktionierten viel einfacher und direkter: Sie stellten soziale Wirklichkeit her.

Diese Deutungskraft von Analysen, die dem vermeintlichen Wahrheitsgehalt von Metadaten heute häufig blind folgt, ist das eigentlich faszinierende. Die Aufladung von Metadaten mit akademischen und journalistischen Wahrheitsunterstellungen ist dagegen eine gefährliche Verherrlichung dessen, was Geheimdienste treiben; als bräuchten die Behörden noch weitere Argumente für ihr Handeln.

Aber die Richtigkeit der Zwecke darf nicht so leicht aus der Wahrhaftigkeit der Mittel abgeleitet werden. Erst recht nicht, wenn immer weniger Menschen und immer mehr Maschinen in diese Deutungsprozesse involviert sind.

0