Zeit für eine Selbstanalyse! Aber nicht im Freudschen Sinne anhand freier Assoziationen – sondern so emotionsbefreit, wie es nur eine Software kann. Gottfried Benn hat ja schon gesagt: „Das Denken muss kalt sein, sonst wird es familiär.“ Das gilt dann wohl auch für die Analyse.
Also: Am Buchmessen-Mittwoch wurde eine Software vorgestellt, die das Bestseller-Potential eines Manuskripts auswerten kann, beziehungsweise: will. Das soll Verlagen helfen, unaufgefordert eingereichte Manuskripte zu sichten – ohne sie, nun ja, zu sichten. Das wäre kosten- und personalsparend und effizienter bei der Bestsellerfrequenz. Und die will ja jeder haben, denn – klar! – more is more.
Wie ihr Name „Bestseller-DNA“ schon andeutet, erfasst die Software den genetischen Bestseller-Code eines Manuskriptes. Wer im Biologie-Unterricht aufgepasst hat, der weiß, wie es um die Doppelhelix steht und woraus sich die Nukleinbasen im menschlichen Körper zusammensetzen. Bei der Bestseller-DNA verhält es sich etwas anders. Hier setzt sich das genetische Bestseller-Gut nicht aus Adenin und Cytosin zusammen, sondern aus dem sogenannten „Bestseller-Score“ und dem „Sentiment-Wert“.
Wie sich diese zusammensetzen, das möchte ich nun herausfinden. Nachdem ich letztes Jahr an dieser Stelle protokolliert habe, wie ich dank einer Buchmessenveranstaltung zu Autorenruhm und dem besten Roman in the history of ever gelangen werde (still in progress), möchte ich nun meinen noch geheimen Zweitling auf Best-Herz und Seller-Nieren prüfen. Die Software ist derzeit noch in der Entwicklung, daher ist dies lediglich ein Beta-Test. Fehler können also auftreten.
+++ Disclaimer: Die beschriebene Software “Bestseller-DNA” befindet sich noch in der Entwicklung. Es gibt sie wirklich, doch der Beta-Test geschah rein gedanklich – so wie es sein könnte. +++
Ich habe das Manuskript glücklicherweise vor ein paar Nächten fertig gestellt und kann die Datei also hochladen. Das Manuskript ist 354 Seiten stark und trägt den Titel „Den Namen ins Wasser geschrieben“. Es geht um Nikita Katastrov, einen russischen Matrosen, der in einer Novembernacht Schiffbruch vor der Küste Schleswig-Holsteins erleidet und sein Gedächtnis verliert. Von einem alten Bauern wird er am Strand in der Nähe von Husum aufgelesen und daraufhin versorgt. Durch seine jahrelange, sibirische Kriegsgefangenschaft spricht der Bauer fließend russisch, zudem erkennt er sich in Teilen in dem Angespülten wieder, da auch der Bauer ein Mal nach einem harten Gewehrschlag vor den Kopf eine Amnesie erlitt. Nikita ist durch seine harte Vergangenheit ein skeptischer Mensch geworden. Dass er sich nicht mehr an die Gründe erinnert, ändert daran nichts. Der Bauer hat große Probleme, zu ihm durchzudringen, doch er gibt nicht auf. An den vielen gemeinsamen Abenden versucht der Bauer immer mehr Erinnerungen in ihm hervorzurufen, durch den Geschmack von Wodka, das Hören von Frauennamen, russischer Märchen und trauriger Lieder. Nach und nach kommen ihm die Erinnerungen wieder. Doch da Nikita zum ersten Mal erkennt, was für ein schlechter Mensch er vor dem Schiffbruch war, ist er mit diesem Leben, das er führte, nicht mehr einverstanden.

Aber jetzt – dawei, dawei! – steckt da Bestseller-Potential drin? Die Datei ist hochgeladen, ich muss nur noch auf „abschicken“ klicken und schauen, was die Software ausgibt. „Bestseller-DNA“ braucht lediglich 30 Sekunden, um die Ergebnisse auszuwerten. Die Software ist nach Silicon-Valley-Vorbild gebaut und selbstverständlich cloudbasiert – aber ob sie aus den Wolken gegriffen ist, das werden wir jetzt sehen. Bei der Präsentation auf der Messe wurde erklärt, dass als Fundament 20.000 Bestseller analysiert und eingespeist wurden, auf der die Intelligenz der Software fußt. Sie soll zudem auch fähig sein, Literatur-Themen und -Trends zu erkennen, wodurch die Verlage Umsatz-Einbußen durch niedrige Bestsellerquoten umgehen können. Neben dem orakelnden Moment der Bestseller-Voraussage soll die Analyse Verlagen auch bei Fragen helfen wie: Wie hoch soll die Auflage sein? Auf welche Zielgruppe sollte sich der Verlag bei dem Buch konzentrieren? Wie hoch soll das Marketing-Budget veranschlagt werden? Und so weiter und so fort.
28, 29, 30 Sekunden! Endlich! Die ersten Ergebnisse sind da. Zuerst findet die Analyse in zwei Schritten heraus, worum es in dem Manuskript geht. Dies geschieht durch eine Wortanalyse, die als Ergebnis ein Cluster der 50 häufigsten Worte erstellt und diese in unterschiedlichen Größen anzeigt. Ganz groß bei mir:
- Nikita, (klar, der Protagonist)
- Paris (dort hat er mal gelebt),
- Wasser (dort hat er gearbeitet, also auf einem Schiff)
- Krankenhaus (dort ist er eingebrochen, um Medikamente zu stehlen)
- Njet (das sagt er gerne)
- Nacht (da trieb er sich rum, weil er nicht schlafen konnte)
- Hahnenkampf (Nikitas Freizeitbeschäftigung und Nebenerwerb)
- Polina (das war Nikitas Geliebte)
Sehr gut. Soweit schon mal erörtert, welche Worte viel Raum einnehmen. Im nächsten Schritt gibt die Software eine Themenübersicht, die sich aus den Worten assoziiert und entwertet. Ich bin gespannt und mache den nächsten Klick. Es erscheint folgendes Ranking:
- Schicksal
- Sex
- Nautik
- Freundschaft
- Erinnerung
- Armut/Kriminalität
- Hahnenkampf
Sieben Themen? Stimmt. Mein Roman ist komplex. Aber das weiß ich ja schon. Viel wichtiger, wen spreche ich damit an? Wer ist meine Zielgruppe? Das erfahre ich im nächsten Schritt. Die Software empfiehlt:
Frauen mittleren Alters || polnische Hafenarbeiter || männliche Twenty-Somethings.
Interessant. Doch wieso? Vielleicht finde ich das im nächsten Schritt heraus? Dort bietet die Software eine Vergleichsebene an, in der ähnliche Bücher aufgelistet werden. Klick. Aha. Aha. „Bestseller-DNA“ erkennt Gemeinsamkeiten zu „Reise ans Ende der Nacht“ (L.-F.Céline), „Der Fänger im Roggen“ (J.D. Salinger), „Ich bin dann mal weg“ (H. Kerkeling) und zum Voynich-Manuskript. Ich glaube, darüber muss ich erst mal nachdenken.

Vielleicht ist Nachdenken aber genau das falsche! Denn das zweite wichtige Merkmal nach der inhaltlichen Ergründung ist für die Software der Sentiment-Wert. Soll heißen: wie wirkt der Text auf meine Leser? Ein Satz wie „Ich fühle mich toll“ kommt gut an bei den Lesern, es vermittelt Wohlbefinden und das überträgt sich auf die Leser. Sentimentwert +1. Ein Satz wie „seit Tagen habe ich die Sonne nicht mehr gesehen und mit niemandem gesprochen“ hat einen Sentimentwert von -2. Da muss man aufpassen. Die Software kann auch eine Sentimentkurve erstellen, die den Romanverlauf zeigt. Jeder Roman beginnt bei einem Sentimentwert von 0 und die Kurve kann und soll steigen und fallen – weil der Text dann packender und mitreißender ist. „Eine Schwingungsstruktur ist wichtig für erfolgreiche Bücher“, wurde auf der Präsentation gesagt, doch der Trend geht im Idealfall nach oben.
Die Software soll noch so weit entwickelt und verbessert werden, dass sie am Ende auch Begründungen abgeben kann: „Themen wie Familie/Alltag kommen gut an, weil es den Lesern vertraut ist. Mehr darauf setzen.“ Oder falls man sich fragt, warum der eigene Bestseller-Score nur 80% beträgt: „Sex sells, aber bei zu viel Sex wirkt es schnell billig.“
So. Und jetzt wirklich. Noch ein Klick, und dann weiß ich, wie hoch mein Bestseller-Score ist! 3, 2, 1 – ich tue es.
„Error 404 – Bestseller-Score konnte nicht gefunden werden.“
Im nächsten Jahr ausgefeilter
Bei meinem letzten Besuch im Silicon Valley im April hat eine AI-Wissenschaftlerin davon berichtet, dass in Japan ein Buch unter Pseudonym auf die Shortlist eines Buchpreises gelangt sei, das komplett von einem Computer geschrieben worden war. Ein normaler Roman, kein Experimentwerk.
Man hatte eine riesige Zahl japanischer Bücher eingespeist, und daraus hat der das System Story, Satzbau, Wortwahl… abgeleitet.
Spooky.