Mitte der 90er Jahre habe ich ein Jahr an einer amerikanischen High School im Süden der USA verbracht. Vieles war dort anders, nicht zuletzt das Schulsystem. Ich habe wesentliche Teile meiner Zeit damit verbracht, 50 Bundesstaaten, 50 Hauptstädte, 40 Präsidenten, 9 Supreme Court Richter, unzählige historische Fakten, und viele Zahlen, Primzahlen, Quadratzahlen, Sinuszahlen auswendig zu lernen.
Letzere nämlich sind wesentlich im amerikanischen Bildungssystem. Vom Schulabschluß bis zur Promotion erfordern “standardized tests” im mathematischen Teil oftmals schnellere und bessere Kopfrechenfähigkeiten als in Deutschland – oder man hat die wichtigen Zahlen einfach auswendig abrufbereit. Im Laufe des Jahres hatte ich reichlich Gelegenheit zu üben – aber anfangs war mir das Konzept der “standardized tests” sehr fremd. Runde Kullerchen mit Bleistift (und nur mit Bleistift!) auf eine Antwortkarte zu malen, die dann später vom Computer gelesen werden würden, das war mir nicht geheuer, wobei mir manchmal der gesamte Ansatz der Wissensvermittlung und -bewertung an der High School nicht geheuer war.
Eine ganz andere Dimension der Leistungsmessung wird in den USA auch aktuell diskutiert – nämlich der Inhalt einer Promotion an Harvards Kennedy School of Government. Eine Doktorarbeit aus dem Jahre 2009 mit dem Titel “IQ and Immigration” wird seit einigen Tagen zwischen Ost- und Westküste heiß diskutiert, und vermutlich an den beiden Küsten am allermeisten.
Der damalige Doktorand, heute ex-wissenschaftlicher Mitarbeiter eines konservativen Think Tanks, versucht darin zu zeigen, daß erstens hispanische Einwanderer in den USA im Durchschnitt einen geringeren IQ haben als die weiße nicht-immigrierte Bevölkerung; zweitens die Ursachen dafür teilweise genetisch sind; und drittens das für die USA aus diversen Gründen schlecht ist und die Einwanderungspolitik entsprechend angepasst werden sollte.
Die damaligen Betreuer, drei durchaus renommierte Professoren, haben inzwische Stellung genommen und berufen sich sinngemäß darauf, daß die Arbeit handwerklich-methodisch durchaus sauber, wenn auch in den Schlußfolgerungen und Politikempfehlungen voreilig und tatsächlich überaus weitreichend sei.
Die öffentliche Diskussion darüber, ob das Rassismus ist, ob man das promovieren darf, und welche Konsequenzen nun angemessen sind, beginnt, sich nach einigen Tagen im Kreis zu drehen – am verblüffendesten an der “Affaire Richwine” ist jedoch, daß bisher kaum jemand die Dissertation gelesen zu haben scheint. Verständlich bei 166 Seiten, aber schon die flüchtige Lektüre ist erhellend.
Richwine erklärt ausführlich das Konzept des IQ und des damit verwandten G-Faktors mit vielen Vewreisen zur American Psychological Association (APA), wobei er natürlich auch nicht völlig den Verdacht ausräumen kann, daß der IQ-Tests den IQ misst, und der IQ das ist, was der IQ-Test misst. Er nutzt verschiedene Datensätze der amerikanischen Bevölkerung, um zu zeigen, daß der durchschnittliche IQ bei hispanischen Immigranten geringer ist als bei “Caucasians”, und zwar auch in der zweiten und dritten Generation von Einwanderern.
Im zweiten der Teil der Dissertation folgt dann eine überaus aufschlußreiche Aufstellung sozio-ökonomischer Faktoren, die statistsch mit dem IQ korrelieren (Kurzsichtigkeit, Impulsivitiät, Großzügigkeit, Kooperationswille – die Liste ist so erschöpfend, daß fast alles irgendwie positiv oder negativ zu korrelieren scheint). Aus dieser Fülle greift unter anderem das “social capital” heraus – ein Begriff, der seit einiger Zeit in den Sozialwissenschaften Mode ist, aber ähnlich schwer festzunageln wie der IQ. Besonders interessant ist eine Tabelle auf S. 103, in der Amerikaner befragt wurden, wie sehr sie den Nachbarn in ihrem Wohnviertel vertrauen. Wohnte im Viertel ein hoher Anteil an schwarzen oder hispanischen Immigranten, fiel das Vertrauen deutlich geringer aus, bei vielen asiatischen Immigranten hingegen nur ein bißchen geringer. Sobald der Autor hingegen den Einfluß von Einkommen, Bildung etc. sowohl der Befragten als auch im Viertel berücksichtigte (quasi: herausrechnete), war der Verunsicherungsbeitrag aller drei ethnischen Gruppen ähnlich groß.
Daraus kann man zweierlei schließen: erstens, daß man offenbar seinen Nachbarn weniger vertraut, wenn diese einen anderen kulturellen Hintergrund haben. Überraschung. Zweitens, daß das natürlich ganz weit weg ist von kausaler Identifikation, und die Beweislage des Autors totz viel mühevoller Kleinstarbeit im Zusammetragen von Quellen und statistischen Tests möglicherweise doch lückenhaft ist.
Ich habe mich nicht weiter in die statistischen Details vertieft, aber vermutlich könnte man mit den Daten vermutlich genausogut argumentieren, daß Immigranten und deren Kinder im Bildungssystem nachhaltig benachteiligt sind und bei standardisierten Tests einfach schlechter abschneiden, die Unterschiede also mehr mit kulturellen Eigenschaften, dem sozioökonomischen Umfeld und der Erziehung zu tun haben. Entsprechende Studien gibt es übrigens, und die Ergebnisse zeigen, daß bei “transracial adoptions” der Einfluß des Umfelds groß ist.
Entsprechend sind die Schlußfolgerungen, die Richwine zieht, ganz sicher hoch gegriffen. Ob man die Arbeit damit für dissertationswürdig hält, darüber kann man sicher streiten – man kann sich aber auch darüber streiten, was man in einer aufgeklärten, meinungsfreien Gesellschaft alles messen soll und darf.
Richwine steht mit seinem Thema nicht alleine da, die Psychometrie als solche ist ja ein durchaus etabliertes Forschungsfeld, und in neuerer Zeit vergreifen sich auch andere Disziplinen gerne an diesen Themen, oft mit kontroversen Ergebnissen. An vorderster Front dabei ein Forscher namens Lynn, der unter anderem zu dem Ergebnis kommt, daß das Volk der !Kung in Afrika den niedrigsten IQ überhaupt hat, nämlich ungefähr in der Größenordnung eines achtjährigen Kindes. Nur daß man natürlich ein achtjähriges Kind sicher nicht im lebensfeindlichen Klima der namibianischen Wüste würde aussetzen wollen, während 8-!Kungkinder dort durchaus zurechtkommen, und die !Kung generell regelrechte Überlebenskünstler sind, angesichts ihres feindlichen klimatischen Umfelds.
Überhaupt werfen die Arbeiten jenes Forschers – abseits von methodischen Defiziten – die Frage auf, inwieweit solche Ergebnisse schlicht und einfach Konsequenz eines ausgeprägten Westzentrismus in der Forschung sind. Wer in einer westlichen Kultur mit westlichen Kategorien und Denkprozessen aufgewachsen ist, schneidet bei solchen Tests vermutlich prinzipiell besser ab als Menschen aus anderen Kulturen, und möglicherweise sind solche kulturellen Unterschiede nachhaltig, und überdauern auch einige Generationen nach der Emigration oder Immigration.
Womit man wieder bei der Ausgangsfrage ist, was der IQ-Test eigentlich mißt. Mit einem ähnlichen Defizit kämpften vor einiger Zeit zwei anderer renommierte Forscher, die sich mit genetischer Diversität von Bevölkerungen und wirtschaftlichem Erfolg befassten. Dabei verwendeten sie tatsächlich ein physiologisches Maß für genetische Unterschiede (“genetic diversity”), allerdings nur für eine relativ kleine Gruppe von Bevölkerungen. Diese wiederum korreliert deutlich mit der Distanz zur Wiege der Menschheit in Afrika (genauer: Addis Abbeba in Äthiopien). Im weiteren arbeiten sie dann mit dieser “migratory distance” als Näherungsmaß für genetische Diversität, wobei sich auch hier die Frage stellt, was diese beiden Variablen eigentlich wirklich messen. Und ob es nicht andere Faktoren gibt, die bei der Analyse außenvor blieben, die Unterschiede in Einkommen und Entwicklung von Ländern aber gleichfalls erklären könnten. In diesem Fall immerhin gab es eine ernsthafte Diskussion, nicht nur über die moralischen Grenzen sozialwissenschaftlicher Forschung, sondern auch über die methodischen Schwächen und Defizite.
Beide Forschungsarbeiten illustrieren sehr deutlich die inhärenten Grenzen sozialwissenschaftlicher Forschung und zeigen, wie wichtig ein kritischer Diskurs über methodische Defizite und überhaupt Methoden und Glaubwürdigkeit ist. Unsauber arbeiten nämlich darf Wissenschaft niemals. Zugegebenermaßen ist das eine Debatte, an der sich vor allem die Fachleute der Disziplinen beteiligen sollten – hingegen müssen Gesellschaften als Ganzes diskutieren und definieren, welche Fragen sie stellen wollen – unter Berücksichtigung der möglichen Antworten.