Home
HERAUSGEGEBEN VON WERNER D'INKA, BERTHOLD KOHLER, GÜNTHER NONNENMACHER, HOLGER STELTZNER
Weitersagen Kommentieren (26)
 

Ein bißchen Erkenntnis: von probabilistischen Gesetzmäßigkeiten

26.12.2012, 15:45 Uhr  ·  Statistische Regularitäten finden sich in der Sprache, in der Musik, und natürlich in Zahlenwerken. Auch ohne zu verstehen, was diese Muster treibt, kann diese Erkenntnis sehr nützlich sein.

Von

 

Statistische Regularitäten finden sich in der Sprache, in der Musik, und natürlich in Zahlenwerken. Auch ohne zu verstehen, was diese Muster treibt, kann diese Erkenntnis sehr nützlich sein.

Forscher haben es nicht leicht mit dem Erkenntnisfortschritt. Selbst bei den sogenannten Naturgesetzen handelt es sich häufig nur um eine Beschreibung – warum die Dinge sind, wie sie sind, können auch Forscher oftmals nicht erklären.

Ganz besonders augenfällig ist dies bei den Potenzgesetzen („power laws“), die das Verhältnis zweier Variablen bei natürlichen Phänomenen mit polynomen Funktionen beschreiben, als zum Beispiel der Art y=a*x^b. Dabei ist das a nur eine Konstante – der entscheidende Bestandteil ist das „hoch b” (also zum Quadrat, oder hoch 3 etc.). Es ist geradezu frappierend, wieviele Zusammenhänge sich in dieser Art entwickeln, vor allem aber sind Potenzgsetze auch nützlich, um Größen- und Häufigkeitsverhältnisse untereinander zu beschreiben. Zum Beispiel stehen die Größe, der Rang und die Häufigkeit vieler Phänomene in einem umgekehrt proportionalen Verhältnis, besagt das (auf Potenzgesetzen aufbauende) Zipfsche Gesetz. Die Stärke und Häufigkeit von Erdbeben nach der Gutenberg-Richter-Skala (je stärker desto seltener) und die Bevölkerungszahl von Städten (wenige Megalopolen, viele kleine Dörfer) lassen sich zum Beispiel damit analysieren.

Bild zu: Ein bißchen Erkenntnis: von probabilistischen Gesetzmäßigkeiten

Das Zipfsche Gesetz gilt zwar für alle möglichen Zusammenhänge, hat aber seinen Ursprung in der Linguistik und wurde von dem Forscher George Kingsley Zipf Mitte des letzten Jahrhunderts mit Bezug zu Texten formuliert. Zipf stellte fest, daß in fast jeder Sprache bestimmte, vor allem kurze Wörter sehr häufig vorkommen , während andere, eher längere Wörter zunehmend seltener werden. Das häufigste Wort, im Englischen „of”, kommt fast doppelt so häufig vor wie das zweithäufigste Wort „to”. Interessant übrigens, daß diese Wörter in verschiedenen Sprachen ganz unterschiedlich sind – bei uns (in vielen Texten) der männliche Artikel „der”, im Englischen Präpositionen, bei den Franzosen erste eine Präposition, dann der weibliche Artikel „la” („le” folgt auf Platz 3). Mit nur 200 Wörtern hat man schon die Hälfte der am häufigsten verwendeten Wörter gelernt.

Faszinierenderweise scheint das Gesetz auch für Musik zu gelten. Ein argentinischer Forscher hat 4 Klavierwerke von Bach bis Schönberg durchkämmt, und die Häufigkeitsverteilung der Noten nach Tonhöhe und -länge aufgezeichnet. Die Noten von Hand zu zählen und aufzulisten wäre sicherlich mühsam gewesen, aber auch da helfen die Segnungen der Moderne, namentlich MIDI. Er stellt fest, daß in allen vier Werken die Statistik erstaunlich gut zu den Vorhersagen des Zipfschen Gesetzes passt. Der Vergleich ist nicht ganz einfach, weil eine hinreichend große Grundgesamtheit von Tonhöhen und -längen notwendig ist. Daher funktioniert es mit 26 Buchstaben nicht annähernd so gut wie mit Wörtern, die aus den unzähligen Kombinationen 26 Buchstaben gebildet werden können, und mit 7 Städten nicht so gut wie mit 700. Auch mit nur 12 Tönen wäre es nicht gegangen – wohl aber mit 12 Tönen in verschiedenen Längen, also vermutlich mindestens 12*5 Tönen, wenn man 16tel bis Ganze zählt.

Bild zu: Ein bißchen Erkenntnis: von probabilistischen Gesetzmäßigkeiten

Ich habe kurz überlegt, ob die musikalische Analyse wohl die Tonart berücksichtigt – man sollte ja meinen, daß das Varianten von C bei Werken in C-Dur sehr viel häufiger sind als andere Töne (das ist schließlich die Tonika). Die Tonalität bleibt allerdings unberücksichtigt und das Zipfsche Gesetz scheint für die Häufigkeit von Tönen in Notentexten ebenfalls erfüllt (allerdings am wenigstens in dem Werk von Schönberg – nicht verwunderlich, da Schönbergs Drei Klavierstücke bereits zu seinen atonalen Werken gehören, und damit wesentlich freier in der Verwendung von Tönen sind (ich vermute, bei Zwölftonmusik würde diese Art der Analyse keinen Sinn mehr machen).

Nun ist es zwar faszinierend, solche statistischen Muster im Alltag zu diagnostizieren – nur leider ist meistens völlig unklar, woher sie stammen. Im Hinblick auf die Sprache gibt es immerhin Erklärungsansätze. Zipf selbst glaubte, daß die an Kommunikation beteiligten Parteien den Arbeitseinsatz gering halten wollen, und sich daher in der Regel auf Kernwörter beschränken. Allerdings gilt der Zusammenhang sogar für Kommunikation, die nicht von Menschen geschaffen wird. Daß das Gesetz auch in der Musik gilt, wo Zweck und Nutzen viel weniger zielgerichtet sind, spricht ebenfalls gegen diese Begründung. Möglicherweise handelt es sich also einfach um eine jener vielen empirischen Regularitäten, die wir nicht erklären können.

Immerhin kann man Regularitäten – mit oder ohne tieferes Verständnis – nutzbringend einsetzen. Zum Beispiel sind die Worthäufigkeiten typisch für bestimmte, Texte, Reden und Autoren, sodaß quantitative Linguistik zur Zuordnung von Werken eingesetzt werden kann. So sind etwa viele delikate Texte des Rokoko aufgrund von Zensur und Verfolgung anonym erschienen; heute, da man sie für Meisterwerke der Aufklärung und nicht mehr für Scheiterhaufenmaterial hält, kann man damit endlich die Autoren würdigen. Ein Spezialfall des Zipfschen Gesetzes ist das Benfordsche Gesetz, welches sich mit der Häufigkeit von Zahlen befasst. Tatsächlich nämlich beginnen die meisten längeren Zahlenfolgen mit einer eins. Die zweithäufigste Anfangsziffer ist die zwei, die dritthäufigste die drei etc. Benford zeigte die Gültigkeit dieser Verteilung für diverse Zusammenhänge, zum Beispiel die Länge von Flüssen und die Bevölkerung amerikanischer Ortschaften.

Bild zu: Ein bißchen Erkenntnis: von probabilistischen Gesetzmäßigkeiten

Diese Eigenschaft läßt sich sehr nutzbringend für alle Arten von Zahlenwerken anwenden: wenn nämlich Menschen versuchen, Datensätze zu manipulieren, vergessen sie das Benfordsche Gesetz und verwenden die falschen Zahlen überproportional häufig. Forensische Statistiker machen sich dieses Phänomen schon länger zunutze, wenn sie Bilanzzahlen auf Wirtschaftskriminalität analysieren, und im Nachhinein wurde festgestellt, daß die Rahmendaten von Griechenland frappierend häufig vom Benfordschen Gesetz abweichen – ebenso wie die von Belgien und Österreiche, wenn auch in geringerem Umfang. Allerdings funktioniert das Gesetz nur, wenn die zugrundeliegenden Daten prinzipiell eine passende Häufigkeitsverteilung aufweisen (nämlich log-normal) – was zum Beispiel bei vielen natürlichen Wachstumsprozessen der Fall ist. Praktischerweise sind diese Gesetze “skaleninvariant” – es macht also keinen Unterschied, ob Flüsse in Meilen oder Metern oder Bilanzen in Dollar oder Euro angegeben werden.

Man kann sich natürlich auf den Standpunkt stellen, daß ein rein aus Beobachtung abgeleitetes Gesetz – zumal wenn es nur näherungsweise gilt, weil probabilistisch – eigentlich den Titel „Gesetz” gar nicht verdient. Anderereseits: Erkenntnis ist Erkenntnis, und in diesem Fall die Voraussetzung, um irgendwann vielleicht doch die ursächlichen Phänomene dahinter zu verstehen.

 

  Weitersagen Kommentieren Empfehlen Drucken
 

Richtlinien für Lesermeinungen

Die FAZ.NET-Redaktion bietet allen registrierten und eingeloggten Nutzern die Möglichkeit, sich mit den aktuellen Beiträgen auf FAZ.NET konstruktiv und kritisch auseinanderzusetzen und eigene Lesermeinungen zu veröffentlichen. Für jede Meinungsäußerung stehen 6000 Zeichen zur Verfügung. Voraussetzung für eine Veröffentlichung ist, dass die Verfasser und Verfasserinnen ihren wirklichen Namen nennen, d.h. in ihrer FAZ.NET-Registrierung den korrekten Vor- und Nachnamen eingetragen haben. Im Falle der Veröffentlichung der Lesermeinung weisen wir am Beitrag den Klarnamen des Lesers aus. Unter Pseudonym oder anonym verfasste Texte können nicht berücksichtigt werden.

Veröffentlicht werden nur Beiträge, die auf den jeweiligen Artikel und sein Thema seriös und sachbezogen eingehen. Links- und rechtsradikale, pornographische, rassistische, beleidigende, verleumderische sowie ruf- und geschäftsschädigende Inhalte können nicht berücksichtigt werden, ebenso wenig sachlich falsche oder in angemessener Zeit nicht nachprüfbare Behauptungen. Links sind in den Lesermeinungen von FAZ.NET nicht gestattet. Die Redaktion behält sich vor Lesermeinungen zu kürzen oder zu modifizieren. Jeder verfasste Beitrag wird von der Redaktion geprüft und schnellstmöglich veröffentlicht, sofern er diesen Richtlinien für Lesermeinungen nicht zuwiderläuft. Nutzern, die wiederholt versuchen, den Richtlinien nicht entsprechende Beiträge zu veröffentlichen, kann die Registrierung entzogen werden.

Für veröffentlichte Meinungsbeiträge gewähren Sie uns das unentgeltliche, zeitlich und örtlich unbegrenzte und nicht ausschließliche Recht, diese Aussagen ganz oder teilweise zu nutzen, zu vervielfältigen, zu modifizieren, anzupassen, zu veröffentlichen, zu übersetzen, zu bearbeiten, zu verbreiten, aufzuführen und darzustellen, Dritten einfache Nutzungsrechte an diesen Aussagen einzuräumen sowie die Aussagen in andere Werke und/oder Medien zu übernehmen.

Weitere Artikel

Datenschutzerklärung

Allgemeine Nutzungsbedingungen von FAZ.NET und seinen Teilbereichen

Wir möchten Sie ausdrücklich darauf hinweisen, dass der gesamte Auftritt von FAZ.NET von verschiedenen Suchmaschinen intensiv ausgewertet wird und die Inhalte dort auch gelistet werden. Das schließt die Lesermeinungen automatisch ein, so dass diese auch über FAZ.NET hinaus im Internet jederzeit recherchierbar sind.

Schließen

Dieser Beitrag kann nicht mehr kommentiert werden
Lesermeinungen zu diesem Artikel (26)
Sortieren nach

Schöner Blog-Eintrag!...

Schöner Blog-Eintrag!

Ein wenig "off topic" "So sind...

Ein wenig "off topic" "So sind etwa viele delikate Texte des Rokoko aufgrund von Zensur und Verfolgung anonym erschienen" Besonders weit sind wir allerdings mit der "moralischen" Beurteilung von Texten seit der Aufklärung allerdings nicht gekommen. Schreiben Sie doch z.B. mal einen Text, der die Lust und die Taten eines Pädophilen detailreich beschreibt - Sie werden kaum einen Verleger finden. Und sollten Sie das "Werk" auf ihrer eigenen Website zugänglich machen, steht schnell die Polizei vor Iher Tür. Und dass, obwohl dadurch NIEMAND verletzt, betrogen usw. wird. Es spricht einfach jemand über seine Fantasie. Wir bewegen uns, wenn nicht zurück, zumindest parallel zum Mittelalter.

verkopfter Blödsinn...

verkopfter Blödsinn

Toller Beitrag. Macht Lust auf...

Toller Beitrag. Macht Lust auf mehr und hat mir wieder mein früheres Nebenfach Linguistik und Phonetik in Erinnerung gerufen; dass im Übrigen viel interessanter war als der Name vermuten lässt.

0 Pérégrinateur 27.12.2012, 05:45 Uhr

„Allerdings funktioniert das...

„Allerdings funktioniert das Gesetz nur, wenn die zugrundeliegenden Daten prinzipiell eine passende Häufigkeitsverteilung aufweisen (nämlich log-normal) …“ — Log-normal trifft es nicht. Log-normalverteilt nennt man nämlich eine Zufallsvariable, deren eigener Logarithmus normalverteilt ist, der also irgend einer Gausschen Glockenkurve folgt. Aber unter denen gibt es sehr enge Verteilungen, nämlich wenn das σ (eine Art von Breite) der Gaussverteilung sehr klein ist. Die Grenzverteilung für σ → 0 ist gerade eine Punktmasse, also eine Verteilung, bei der eine ihr genügende Zufallsvariable immer denselben Wert annimmt; offensichtlich ist mit dem Logarithmus dann auch die Größe immer gleich, dann ist auch die führende Ziffer immer dieselbe, also kann sie gar nicht benfordverteilt sein, weil die Benfordverteilung der Ziffer d als erster Ziffer, d aus [1, 9], die Häufigkeit lg(d+1) - lg(d) zuspricht, also für kein einziges d die 0. Oft genannt als eine Bedingung dafü , das eine Größe mehr oder weniger benfordverteilt ist, wird die Kombination der beiden Bedingungen: 1. Die Größe schwankt über einige Zehnerpotenzen 2. Ihr Logarithmus ist in diesem Bereich einigermaßen gleichverteilt Die Bedingung 2 könnte man, analog zur Wortbildung bei log-normal, so formulieren: Die Größe ist log-gleichverteilt. Ob das ein gängiger Ausdruck ist, weiß ich nicht. Log-normal täte es auch, unter der nach dem Vorhergehenden allerdings nötigen Bedingung, dass das genannte σ hinreichend groß ist, etwa größer als ein kleines Mehrfaches von ln(10). Dann ist nämlich der bestimmende, bei genügend Breite über einige Logarithmen von Zehnerpotenzen hinweg hinreichend flache Gipfel der Verteilung annähernd eine Gleichverteilung. Übrigens habe ich nirgends in der Presse gelesen, dass bei den heftig kritisierten Wahlen im Iran vor einigen Jahren hinreichend deutliche Abweichungen von einer Benfordverteilung festgestellt worden wären. Aber zum Glück hat man ja bei den wirklich wichtigen Dingen auch andere Kriterien dafür, wer die Guten und die Bösen sind. Im Idealfall kommen vorgehende Gewissheit und empirischer Nachweis zusammen: Der Staat Saudi-Arabien ist ein guter Staat, und nachweislich wurde dort noch nie eine Parlamentswahl gefälscht.

0 sophia.infinitesimalia 27.12.2012, 08:17 Uhr

Tobias, danke! . Posten, das...

Tobias, danke! . Posten, das ist mehr als nur "ein wenig" off-topic. . wolfie, hat Sie ja niemand zum Lesen gezwungen, oder?

0 sophia.infinitesimalia 27.12.2012, 08:19 Uhr

Heinz, es gibt so viel...

Heinz, es gibt so viel Fächer, die spannender sind, als man meint. Freut mich, wenn es anregend war! . Pérégrinateur, vielen Dank für die detaillierte Erläuterung... genau dafür sind Kommentare so praktisch, im Text nämlich würde so etwas zu sehr in die technisch Tiefe gehen, aber auf meine Leser ist doch immer Verlaß!

Ein schöner Beitrag. Vielen...

Ein schöner Beitrag. Vielen Dank !

Hängt es nicht irgendwie mit...

Hängt es nicht irgendwie mit Huffman-Kodierung zusammen ?

der gute alte Zipf, wer denkt...

der gute alte Zipf, wer denkt schon an ihn, wenn man heute so vor sich hingoogelt. Mindestens zwei Autoren wehren sich bis heute erfolgreich gegen ihre Identifizierung durch Verfahren der Mathematischen Linguistic; der eine ist wohlbekannt, William, der andere weniger, Daniel Defoe, der sich einen Spass machte andere zu imitieren. @posten - es gibt kein Verbrechen, das nicht zuvor (schriftlich) beschrieben wurde - so das Sprichwort. Und, es gibt Grenzen, die man nicht ueberschreiten sollte.

Exponentielles Wachstum folgt...

Exponentielles Wachstum folgt KEINEM Potenzgesetz! Im zweiten Absatz wird exponentielles Wachstum (z.B. einer Bevölkerung) als Beispiel eines Potenzgesetzes genannt - dies zeigt, dass Sophia Amalie Antoinette Infinitesimalia leider den Kern der Sache total missverstanden hat: Bezeichnet x die unabhängige Variable (z.B. die Zeit) und y die abhängige Variable, so ist y=a * x^b eine Potenzfunktion, y = a * b^x eine Exponentialfunktion - zwei vollkommen unterschiedliche Dinge! Dies wird z.B. für b=2 sofort deutlich: y=x^2 entspricht einer nach oben geöffneten Parabel (für x=-2,-1,0,1,2 erhält man die y-Werte 4,1,0,1,4); dagegen ist y=2^x eine Funtion, die *immer* wächst (für x=-2,-1,0,1,2 erhält man die y-Werte 1/4,1/2,1,2,4) - für große x sogar schneller als jede Potenzfunktion. Und wer denkt, diese Unterschiede seien doch nachrangig, möge den Verlauf der Funktion y = 3^x mit dem der Funktion y = x^3 vergleichen... Die schönen Worte des Textes können diesen fundamentalen Fehler nicht kitten. Andreas

@Andreas: ich dachte schon,...

@Andreas: ich dachte schon, das fällt hier gar keinem auf! Die Frage ist: hat der Autor seine Mathematikausbildung in der Hauptschule abgeschlossen und gefällt sich nun darin, genauso Ahnungslosen scheinbare tiefschüfende Weisheiten mitzuteilen, die in Wirklichkeit eine Ansammlung angelesener, jedoch in keinster Weise verstandener, Versatzstücke aus dem Wissenschaftsfeuillton sind? Oder macht er sich einfach lustig über die oben gesammelten Kommentare, die zeigen, dass man selbst mit völlig konfusem Zeugs die Leute beeindrucken kann?

0 sophia.infinitesimalia 27.12.2012, 12:56 Uhr

kzin, immer gern! . og, das...

kzin, immer gern! . og, das mußte ich erst mal anschauen - und sehe keinen unmittelbaren Zusammenhang, aber ich kann mich auch täuschen. . pmohler, kaum jemand denkt an Zipf. Ich kannte ihn ja auch nicht, bevor ich mich systematisch damit befasst hab.

0 sophia.infinitesimalia 27.12.2012, 12:59 Uhr

Andreas, unter bestimmten...

Andreas, unter bestimmten Umständen weist exponentielles Wachstum Zipf-Eigenschaften auf, exponentielles Städtewachstum zum Beispiel. Da der Beitrag aber keine Mathematikstunde sein soll, erlaube ich mir gelegentliche Unschärfen, und freue mich, wenn mein Leser präzisieren (oder gelegentliche Fehler korrigieren). Wenn sie das auf charmante Art tun, wie Pérégrinateur, freue ich mich besonders, aber auch Oberlehrer dürfen sich in diesem Salon gern ausleben. Noch einen Tee?
.
Jochen, dito.

Liebe Sophia Amalie Antoinette...

Liebe Sophia Amalie Antoinette Infinitesimalia, eines schönen Tages schrieb Sophia in einer angesehenen Zeitung, dass 1=2 sei (verkürzt, um es auf den Punkt zu bringen). Dies verwunderte den Leser Andreas sehr, der bis dato große Stücke auf diese Zeitung gehalten hatte. Deshalb schrieb er der Zeitung und wies freundlich darauf hin, dass sich Sophia vergaloppiert habe. Und was kam als Antwort zurück? Ein neues Beispiel, das verdeutlichen sollte, dass "unter bestimmten Umständen" doch 1=2 sei. Kann aber doch nicht sein! [[NB: Die mögliche Zipf-Eigenschaft der Städtegrößen hat nichts mit deren exponentiellem Wachstum zu tun, da dabei das Verhältnis der Einwohnerzahlen gleich bleibt (bei gleicher Wachstumrate) oder sich ansonsten exponentiell in der Zeit ändert.]] Maxl wird sich freuen, wenn er in Grund-, Haupt-, Real-, Hoch- oder sonstiger Schule bei der nächste Matheprobe einen groben Schnitzer gemacht hat und dann unter Verweis auf die F.A.Z. den Lehrer darauf hinweisen kann, dass er sich doch nur eine "Unschärfe" erlaubt habe. Da wird der Lehrer schon seinen ganzen Charme zusammennehmen müssen! Vor allem, wenn Maxl dann auch noch Oberlehrer-Allüren suggeriert. Nein, liebe Sophia, mit dieser Anwort schaden Sie leider nur dem eigenen Anliegen - und dies ist schon recht bitter. Ging's in Ihrem Beitrag nicht um "Erkenntnis"? Da ist's schon wichtig, ob 1=2 gilt oder nicht - die Mathe macht an der Schultüre nicht halt - und das ist gut so! Andreas

0 sophia.infinitesimalia 27.12.2012, 14:26 Uhr

Andreas, wir wollen ja die...

Andreas, wir wollen ja die potentiell lernwilligen Schüler nicht verwirren, daher editiert.

Da hat Andreas schon recht....

Da hat Andreas schon recht. Wachstum und Explosion sind mehr als nur eine Unschärfe voneinander entfernt und falsch ist auch nicht ein bisschen richtig. Und wie immer wenn über probabilistische Gesetzmäßigkeiten geschrieben wird findet man auch hier viel Dampf: "Mit nur 200 Wörtern hat man schon die Hälfte der am häufigsten verwendeten Wörter gelernt." Hat man dann mit 400 schon alle häufigen gelernt? Und wie viele bleiben dann übrig? Und wie häufig fehlt mir dann das richtige Wort?

0 sophia.infinitesimalia 27.12.2012, 15:49 Uhr

dt, Explosion? Das Wort kommt...

dt, Explosion? Das Wort kommt im Beitrag gar nicht vor. Davon abgesehen: lesen Sie den Satz noch mal. Die Hälfte der am_häufigsten_verwendeten_Wörter. Das ist ähnlich hilfreich, wie zu wissen, daß man nur mit einer sehr sehr kleinen Wahrscheinlichkeit vom Blitz erschlagen wird. Wenn es passiert ist, ist die Wahrscheinlichkeit allerdings 1. Beides ist Statistik, beides ist interessant, was man damit im Alltag anfängt, eine völlig andere Sache.

Was mich stört, ist, dass...

Was mich stört, ist, dass hier eine "Gesetzmäßigkeit" angenommen wird. Menschen sind aber nun ein Mal emergent im Verhalten. Es mag richtig sein, dass im Nachhinein irgeneine Form von mathematischer Regel zu erkennen ist (wobei mich schon immer gestört hat, dass der negative Anteil der Kurven einfach nicht gesehen werden darf), aber das gilt auch für beliebige Objekte, wie das berühmte holländische Fahrrad ja bewies (auch da sind erstaunliche mathematische Zusammenhänge gefunden worden). Für Musik oder Sprache ist es mir egal, aber wenn behauptet wird, menschliches Verhalten sei regelmäßig und dann womöglich noch Behauptungen für die Zukunft aufgestellt werden (im Sinne von unvermeidbar, weil nun mal mathematisch festlegbar), dann wird es richtig gefährlich. Aber genau das wird IMHO im Artikel zumindest suggeriert.

0 Magnus Göller 27.12.2012, 16:24 Uhr

Leser dt hat völlig recht:...

Leser dt hat völlig recht: Auch das mit den 200 Wörtern ist, was Sophia vornehm eine "Unschärfe" nennte. Denn mit dem häufigsten und dem zweithäufigesten Wort wären ja auch schon "die häufigsten" Wörter gelernt... Die häufigsten Wörter sind überdies wohl in den meisten (allen?) Sprachen sogenannte Strukturwörter (Artikel, Präpositionen, Konjunktionen, fundamentale Adverbien), aus denen sich kein vernünftiger längerer eigenständiger Aussagesatz bilden lässt. Dass diese eher kurz sind, liegt auf der Hand. Ein Volk, das etwa "und" mittels eines Fünfsilbers und "hier" mittels eines Sechsilbers ausdrückte, überlebte wohl nicht lange. Es kann also fast gar nicht anders sein; das hat mit Statistik nicht die Bohne etwas zu tun, sondern mit der notwendigen Funktionalität bzw. Effektivität gerade auch elementarer Sprechakte.

0 vielen Dank 27.12.2012, 17:38 Uhr

sind wir von der Rolle oder...

sind wir von der Rolle oder hat die nachweihnachtliche Verstimmung zugeschlagen oder versuchen einige die fast infinitesimale Geduld von Sophia auf Null zu setzen? Offensichtlich freut sich aber der eine oder andere, mich eingeschlossen, der mal etwas mit mathematischer Linguistik zu tun hat ueber diesen Beitrag. Ist es nicht wunderschoen zu sehen, wie sich in der scheinbaren ungeordneten Struktur von Sprache (und vielem Anderen) zahlenmaessig fass- und messbare statistische Ordnungen finden lassen?! Mich begeistert das, und wenn ich es genauer wissen will, kann ich mich ja von der Fachliteratur in den Schlaf wiegen lassen.

0 sophia.infinitesimalia 27.12.2012, 20:22 Uhr

lef, das habe ich mitnichten...

lef, das habe ich mitnichten behauptet. Intelligente Forscher wissen, daß probabilistisch nunmal keine sicheren Vorhersagen erlaubt, sondern nur Näherungen und Vermutungen. Gesetzmäßig ist allerdings: wenn sie eine Münze oft genug schmeißen, wird sie mit annähernd 50 % Wahrscheinlichkeit auf jeder der beiden Seiten landen. Unweigerlich. . Magnus Göller, schön, daß Sie sich mit Zipfs Erklärung für das Phänomen identifizieren können. Das mit den 200 Wörtern ist hingegen keine Unschärfe, sondern Tatsache. Aber eben ein kuriose Illustration des Nutzens von Statistik: erstaunlich, daß die meisten Texte vorwiegend aus relativ wenigen Worten bestehen (den 200 nämlich) - aber ohne die 500 oder 800 anderen Wörter (die nur einmal im Text vorkommen) hilft einem das trotzdem nicht bei der Kommunikation.

0 sophia.infinitesimalia 27.12.2012, 20:36 Uhr

vielen Dank, es ist...

vielen Dank, es ist befriedigend (und ermutigend), zu sehen, daß manche Leser die eigentliche Intention des Beitrags zu schätzen wissen. Aber wenn ich ein Steilvorlage für Erbsenzählerei liefern kann (die ja auch eine Quelle der Befriedigung sein kann), ist das immerhin ein post-weihnachtlicher Dienst an meinen Mitmenschen.

0 waskostetdiewelt 28.12.2012, 01:51 Uhr

Nun ja, bei aller relativen...

Nun ja, bei aller relativen Unschärfe immerhin nonchalant charmant, sorgfältig abgezählte Kleinerbsen als Wechselgeld zum Klingen gebracht: auch eine Weihnachtsbescherung. Friede.

0 sophia.infinitesimalia 28.12.2012, 08:41 Uhr

waskostetdiewelt, vielen...

waskostetdiewelt, vielen Dank für das konziliante Einschreiten... die Leser haben in der Sache ohne Zweifel recht, und am Ende sind die Kommntare hier stets das Salz in der Suppe!

0 Herold Binsack 31.12.2012, 17:12 Uhr

Ziellos, dennoch...

Ziellos, dennoch erfolgreich . In der Naturbeobachtung stoßen wir immer wieder auf ein und dasselbe Phänomen: Kleine Ursache, große Wirkung. Und dafür kann es im Prinzip nur eine Erklärung geben: Der Natur ist das Individuum fremd. Physikalisch gesprochen folgt es dem Fraktale-Algorithmus - http://blog.herold-binsack.eu/?p=2252 -, biologisch der Schwarmintelligenz. Wir Menschen scheinen ob unserer Subjektivität/Individualität eine Ausnahme zu sein. Doch auch wir handeln vermutlich unbewusst wie wohl auch stellenweise bewusst nach einem Rhythmus. Und wenn ich das Wort Rhythmus so betrachte, dann will es mir nicht merkwürdig erscheinen, dass wir uns auch bei der künstlerischen Gestaltung von Tönen von einem vergleichbaren Gesetz leiten lassen, das da lautet: Geringstmöglicher Aufwand auch und gerade bei maximalen Kombinationsmöglichkeiten. Und vergessen wir auch nicht ein weiteres Phänomen, was diese Theorie zu bestätigen scheint: So erachten wir ein Kunstwerk nur als ein solches, wenn der (individuelle) Arbeitsaufwand (des Künstlers) darin möglichst nicht zu erkennen ist. Dass wir das dann u. U. einem „Genie“ zuordnen wünschen, folgt der Logik jener falschen Ideologie, welche das Kunstwerk einem Einzelnen - dem Künstler - zuspricht, und eben nicht der Gesellschaft, welche Künstler wie Kunstwerk gleichermaßen erst hervorbrachte. Und da weder Fraktale-Algorithmen noch Schwarmintelligenzen strategische Ziele verfolgen, vermuten wir hierbei probabilistische Gesetzmäßigkeiten. Wir Subjekte, welche sich als Individuen immer von Zielen leiten lassen, staunen nur, ob der darin erkannten Tatsache, dass man offenbar auch ziellos, erfolgreich sein kann. Da wir das aber nicht wirklich verstehen, stellt sich uns eine solche Bewegung als „Annäherung“ dar. Doch worin unterscheiden sich Ergebnis und annäherungsweise erreichte Ziele? . Nehmen wir die Bienen und den Honig. Dass die Bienen den Honig nachhause gebracht haben, kann man als Ergebnis betrachten. Doch war es dies auch das Ziel? Wo es kein Bienenindividuum gibt, kann es auch keine Biene geben, die dem Ziel folgt Honig nachhause zu bringen. Der Honig ist das Ergebnis verschiedener – vermutlich hormonell gesteuerter – Zusammenhänge. Alle Bienen zusammen ergeben quasi einen Organismus. Doch dieser Organismus macht die einzelnen Bienen dennoch nicht zu fremdgesteuerten Maschinen. Es gibt keine Zentrale, von wo aus der „Bienenstaat“ gesteuert wird. Jede Biene ist ein biologisches Unikat. Und nur indem jede Biene ihren eigenen Impulsen – Trieben – folgt, ergibt sich jene Schwarmintelligenz, welche messbare Ergebnisse – Honig – zeitigt (ich vermeide das Wort „erzielt“). Doch indem dieser Honig eben nicht selbst verzehrt wird, sondern dem nachkommenden Schwarm zugefüttert, zeigt sich wiederum jene geradezu notwendige Ziellosigkeit in diesem Schwarmverhalten. Hätten die Bienen Ziele – gleich als Einzelne oder im Schwarm –, könnte es passieren, dass sie entarten und den Honig selber verzehren. Das würde nicht nur den Schwarm vernichten, sondern ein Bienenindividuum, ein Bienensubjekt (einen wirklichen Bienenstaat gar) womöglich, kreieren. Eine dem Menschen grauenhafte Vorstellung. . Doch am Beispiel des Menschen können wir sehen, wie gefährlich ein solches Subjekt als menschliches Individuum - und erst recht im Schwarm - sein kann, und daher in der Natur eben nur ausnahmsweise geduldet.

wurde schon frühzeitig von einem Magister der Mathematik bescheinigt, sie möge ob ihrer Unfähigkeit im Umgang mit Zahlen und Formeln nicht allzu betrübt sein, es gebe reichlich schöne Berufe ohne dieselbe, insbesondere ein Broterwerb als Kammerjungfer oder Hausfrau wurde ihr nahegelegt.