Deus ex Machina

Deus ex Machina

Über Gott und die WWWelt

Wunsch oder Wahrheit: Die Statistik

worin vorgestellt werden: die Statistik, die Korrelation, die Kausalität, deren Nutzen, Frommen und Mißbrauch wie auch allerlei Diebe und Verdreher derselben.

worin vorgestellt werden: die Statistik, die Korrelation, die Kausalität, deren Nutzen, Frommen und Mißbrauch, wie auch allerlei Diebe und Verdreher derselben.

Bei dem Wort Statistik denken wir an endlose Zahlenkolonnen, an Mittelwerte und Korrelationen und andere langweilige, wüstentrockene Dinge. Für Menschen, die die Welt in Zahlenkolonnen erfassen wollen, Schreibtischhengste, Bürokratentäter, Datensammler. Interessant ist das allenfalls, wenn es im sexy Kostüm daherkommt: Unfallstatistik zum Beispiel, oder Kriminalstatistik. Da wittert man latente Skandale, Gruselgeschichten, obskure Gefahren.

Statistiken sind zuallererst nur eine Sammlung von Fakten in Zahlen. Unzählige Reihen und Spalten, gerne deutlich jenseits des Fassungsvermögens der gängigen Tabellensoftware (ja! da gibt es Grenzen), Unmengen von kleinen Informations-Puzzleteilen. Bestenfalls langweilig. Schlimmstenfalls ein Alptraum für den Datenschutz, nämlich wenn wertvolle – schlimmstenfalls persönliche – Daten verloren gehen. Und je persönlicher, desto schlimmer. Manches Unternehmen, hier und im Ausland, mußte in den letzten Jahren so eine Datenkuh vom Eis ziehen, und man kann nur hoffen, daß sie daraus gelernt haben.

Bild zu: Wunsch oder Wahrheit: Die Statistik

Immerhin, über Datenverlust, Datenschutz und Datenschlamperei werden wir gelegentlich informiert, wann immer Daten an unerwarteten Orten (bevorzugt dem Internet) auftauchen. Das ist nicht schön, aber es sensibilisiert für die Gefahren. Überhaupt nicht sensibilisiert sind wir hingegen für die vielen Mißverständnisse, die schon bei der Interpretation der einfachsten statistischen Kennzahlen entstehen können.

Die Informationsfülle eines umfangreichen Datensatzes ist so komplex, daß damit in Rohform nicht viel anzufangen ist. Ein Puzzle durch die Summe seiner Teile zu beschreiben wäre ein mühevolles Unterfangen, einfacher ist es, Angaben zum Gesamtbild zu machen und das tut auch die Statistik. Zentrale Maße, die Informationen kondensiert und aggregiert wiedergeben, müssen her, damit die Information handlich und portionsgerecht für den 2-Minuten-Einspieler im Fernsehen oder drei Absätze in der Zeitung werden. Der unumstrittene Herrscher unter den zentralen Maßen ist natürlich der Durchschnitt. Eigentlich ist es nicht schwer, sich klarzumachen, wie verzerrend der Durchschnitt ist – das sollte man schon in der Schule begriffen haben: ob eine Klasse lauter Dreier-Schüler hat oder nur Streber mit Einsen und Trottel mit Fünfen, der Durchschnitt kann in beiden Fällen der gleiche sein, obwohl die Klassen völlig unterschiedlich sind. Erst die Standardabweichung gibt näheren Aufschluß über die Verteilung (weit gestreut oder eng fokussiert um den Durchschnittswert), aber das geht im Alltag unter. Ich jedenfalls habe noch nie in einem Zeitungsartikel neben dem Durchschnitt die Standardabweichung zitiert gesehen.

Bild zu: Wunsch oder Wahrheit: Die Statistik

Etwas komplizierter und noch verheerender in verständnislosen Händen ist die Korrelation, gewissermaßen die kleine Schwester des kausalen Zusammenhangs. Im Frühling werden besonders viele Kinder geboren und gleichzeitig kommen die Störche aus dem Süden zurück – das ist Korrelation. Der Storch bringt die Kinder – das wäre Kausalität, allerdings wissen wir es seit der Bravo-Lektüre besser: die gibt es in diesem Fall nicht. Kausalität ohne statistische Korrelation ist ausgeschlossen, aber Korrelation ohne Kausalität sehr gut möglich. Der gute Statistiker wird das sorgfältig vermerken, wenn er die Ergebnisse seiner Studie in einem schönen, langen Bericht zu Papier bringt, dafür hat er schließlich lange genug studiert. Hoffentlich.

Der Bericht hat jedoch noch einen langen Weg vor sich, wandert durch viele Hände und nicht immer durch die richtigen. Auf ihrem Weg über die Schreibtische von wissenschaftlichen Mitarbeitern im Bundestag, politischen Referenten und Journalisten verwandelt sich die sachliche, statistische Angabe in eine politisch instrumentalisierbare Neuigkeit, ein Wahlkampfargument oder eine Schlagzeile. Wo Wissenschaftler eine simple Korrelation bei der Nutzung von Computerspielen und Fernsehern und den schulischen Leistungen herstellen, folgt rasch die Forderung, Computerspiele zu indizieren. Weil schlecht für die Bildung. Oder auch: Daddeln macht Doof. Nun ist der Zusammenhang unbestreitbar intuitiv ansprechend und Wasser auf die Mühlen der Zensurfanatiker. Die Korrelation als Beweis für die Kausalität heranzuziehen, oder auch nur durch Formulierungen zu unterstellen, der statistische Zusammenhang mache diese Schlußfolgerung logisch, ist jedoch grundfalsch.

Bild zu: Wunsch oder Wahrheit: Die Statistik

Denkt man etwas länger über die möglichen Ursachen nach, gibt es drei verschiedene Möglichkeiten. Nennen wir, um beim Beispiel zu bleiben, den Medienkonsum A und die schulischen Leistungen B. Tatsächlich gibt es drei alternative Erklärungen:

1. A verursacht B. Kinder mit hohem Medienkonsum werden dadurch in der Schule schlechter, sprich: dümmer.

2. B verursacht A. Nur zu Anfang abwegig, aber ist es wirklich so unwahrscheinlich, daß weniger intelligente Kinder von sich aus mehr Fernsehen gucken?

3. Irgendein verdeckter Faktor C beeinflußt A und B. Zum Beispiel: Fürsorge und Bildung des Elternhauses beeinflussen Medienkonsum wie auch die Schulleistungen.

Wollte man der Politik raten, so fielen die Maßnahmen sehr unterschiedlich aus, je nachdem welche Kausalität man unterstellt. Und wäre der Grund für das Schulversagen im Elternhaus zu sehen (und nicht im Medienkonsum) müßte man folgerichtig genau dort ansetzen, bei der Betreuung der Kinder. Das jedoch sind ganz offensichtlich völlig unterschiedliche Strategien. Die simple Korrelation zwischen Medienkonsum und Schulleistungen sagt jedenfalls nicht, welches der bestimmende Zusammenhang ist. In Verbindung mit anderen Studien und Methoden mag das Bild klarer werden, aber diese Studie allein ist kein tragfähiger Beweis. Was natürlich Politiker und Journalisten nicht davon abhält, ihr lausiges Mißverständnis statistischer Grundlagen in die Welt zu schreien. Und schnell entsprechende Maßnahmen zu fordern.

Beides, die Fehlerinterpretation und ihre Folgen, entwickeln in der schönen, neuen Internet-Welt schnell eine Eigendynamik. Die These wird aufgegriffen, im Internet noch schneller weitergetragen als früher auf dem Papier, und obwohl es so einfach wäre, die Originalquelle zu verlinken, sucht man oft vergeblich danach. Während man sich also bemüht, den vielen Verbindungen ins Dickicht der Meinungs- und Meldungsvielfalt zu folgen, um die ursprüngliche Studie ausfinding zu machen, wird die verdrehte Statistik fröhlich weitergereicht wird und vervielfältigt sich selbst.

Am Ende solcher Mißverständnisse werden nach einigem politischen Ringen Entscheidungen über die Verwendung von Steuergeldern und die Kontrolle von Medien getroffen, basierend auf einer Fehlinterpretation statistischer Daten. Hätten mehr Menschen begriffen, daß eine Korrelation noch keine Kausalität ist, wäre das nicht passiert.

Also bitte: passen Sie das nächste Mal auf, wenn Ihnen eine Kausalität begegnet, bitten Sie sie, sich ordentlich vorzustellen, mit ganzem Namen – um sicherzugehen, daß es nicht nur eine Korrelation ist. Die wäre nämlich mit Vorsicht zu genießen.