Bestseller or no Bestseller – das ist hier die Frage

Was mache ich nur mit diesem Buch? Diese Frage stelle ich mir im Grunde schon seit ich die ersten paar Seiten von Matthew Jockers‘ und Jodie Archers neuem Buch „Der Bestseller-Code“ gelesen habe. Es steht außer Frage, dass es ein äußerst spannendes Sachbuch ist, das über ein kühnes literaturwissenschaftliches Projekt – nämlich den Versuch, Bestseller von nicht-Bestsellern mittels computerunterstützer Methoden zu trennen und sogar Vorhersagbarkeit zu erreichen- berichtet. Dennoch: Es ist nicht so ganz Fisch und auch nicht Fleisch. Für ein literaturwissenschaftliches Werk ist es zu unkonkret, genauso wie für einen Schreibratgeber. Trotzdem bietet es seinen Lesern einfach eine sehr unterhaltsame Show, die mit viel Digital Humanities Magie (und wenigen Blicken in die Black Box) gewürzt wurde.

Was macht einen Bestseller aus und ist kommerzieller Erfolg bei Büchern vorhersagbar?

Unglaublich aber wahr, dies ist die Fragestellung, der Jockers und Archer in einer ohne Frage beeindruckenden fünfjährigen Forschungsarbeit nachgegangen sind. Dass dies nicht unbedingt im Kerninteresse der Literaturwissenschaft, sondern eher für das Literatur-Business von Bedeutung ist, wissen die Autoren selbst und nehmen es anscheinend auch zum Anlass sich von ersterer etwas ab- und zu letzterem etwas hinzuwenden. Natürlich steht am Anfang ihres fünfjährigen Projektes ein wenig Digital Humanities Magie, denn als allererstes haben die beiden anhand eines Testkorpus geprüft, ob ein Computer überhaupt einigermaßen zuverlässig Bestseller von nicht-Bestsellern unterscheiden kann. Das Ergebnis war ausreichend beeindruckend, um sich auf die Suche nach dem Geheimnis der sich hervorragend verkaufenden Bücher zu begeben.

Was sind Bestseller?

Dann haben die Autoren ein Forschungskorpus aufgebaut, das aus sage und schreibe 5.000 zeitgenössischen Romanen besteht. Diese wurden in zwei Gruppen geteilt, die Beststeller und die nicht-Bestseller. Wie bei jeder guten computergestützten Untersuchung musste natürlich auch hier zuerst genau definiert werden, was als Bestseller gekennzeichnet werden soll. Und hier kommen wir gleich zur ersten Schwäche des Buches, denn die Autoren entscheiden sich an dieser Stelle dafür, diejenigen Romane als Bestseller zu markieren, die es auf die New York Times Bestseller-Liste geschafft haben. Daran ist per se noch nichts verkehrt, doch im Folgenden gehen die beiden meistens davon aus, dass sie ein mehr oder weniger weltweites Phänomen betrachten. New York Times Bestseller scheinen für sie Weltbestseller zu sein (was zwar teilweise auch stimmt, aber eben nur teilweise). Und obwohl sie ein wenig darauf herum reiten, dass die sprachlichen Gepflogenheiten im britischen und amerikanischen Englisch variieren, verlieren sie keine Worte darüber, dass sie auch übersetzte Texte in ihrem Korpus haben (wie z.B. Stig Larssons Millennium-Trilogie, auf die sie in anderer Hinsicht auch genauer zu sprechen kommen) und was die Übersetzung für die auf Sprache basierenden Analysen bedeuten könnte. Es wird also nicht so richtig klar, wie das Korpus beschaffen ist und welche Störfaktoren hier auf die Untersuchung einwirken könnten. Vielleicht ist dies aber auch nur ein erster Hinweis darauf, dass wir es nicht mit einer wissenschaftlichen Abhandlung zu tun haben.

Die magische Black Box

Und damit sind wir auch schon bei dem Thema, das mich beim Lesen am meisten frustriert hat – die Methode bleibt vage und so etwas wie Reproduzierbarkeit sucht man vergebens. Nun kann man als digitaler Geistewissenschaftler zwar einzelne Bausteine des von Jockers und Archer liebevoll “Bestseller-o-meter” genannten Wunderalgorithmus erahnen. Da ist etwas Stilometrie mit drinnen, Topic Modelling, Sentiment Analysis und noch ein paar andere Methoden. Auch auf nicht digitale Methoden wie eine vergleichende Analyse von Titeln greifen die beiden zurück. Doch immer wieder kommen die Autoren darauf zu sprechen, dass ihr Computer ihnen Wahrscheinlichkeiten geben würde, wie z.B. “Dieses Buch ist zu 96,7% ein Bestseller”. Wie genau er zu einer solchen Einschätzung kommt, ist mir nicht klar geworden. Gibt es eine Art Tool-Pipeline mit Hilfe derer am Ende eine Gesamtauswertung vorgenommen wird? Oder steht nach jeder Einzelauswertung eine solche Vorhersage und dann wird ein Mittelwert bestimmt? Und wie passt dann so etwas wie eine Titel-Analyse ins Bild? Gibt es tatsächlich den einen, bahnbrechenden Algorithmus zur Vorhersage eines Bestsellers, der von Autoren und Verlagen zwecks Marketing propagiert wird oder sind vielmehr viele Einzelschritte nötig? Es ist mir klar, dass die Autoren nie das Versprechen machen, auf diese Fragen einzugehen und dass dahinter wahrscheinlich marktstrategische Gründe stehen, die eine bewusste Abkehr von der wissenschaftlichen Community bedeuten (ja, Jockers/Archer haben tatsächlich so etwas wie eine Literatur-(oder sollte ich besser sagen Bestseller-)Agentur gegründet). Trotzdem machte es mich beim Lesen ganz kribbelig, dass genau diese Details hinter Allgemeinheiten verschleiert blieben.

Der Bestseller-Code

Genug gemeckert, kommen wir endlich zu den Errungenschaften dieses Buches. Zunächst einmal rückt es Bücher in den Vordergrund, die oft und auch oft gerne gelesen werden. Dafür wurden sie zwar bereits in anderen Rezensionen gelobt, aber ich führe das hier auch noch einmal an, da dies wirklich auch ein literaturwissenschaftlich bedeutsamer Schritt ist. Außerdem haben sie das Unglaubliche geschafft und ein ziemlich belastbares System von Textanalysen auf Wortbasis gebaut, mit Hilfe dessen nicht nur die Gemeinsamkeiten amerikanischer Bestseller besser analysiert, sondern auch Texte auf ihre Bestseller-Tauglichkeit geprüft werden können. Schließlich beschreiben sie die Eckpfeiler dieses Systems und die Merkmale von Bestsellern und kommerziell weniger erfolgreichen Büchern. Das sind zum Beispiel Dinge wie am häufigsten verwendete Wörter oder die quantitative Verteilung von Themen im Text. Auch konkrete Tipps für Autoren können dabei herauskommen. So empfiehlt es sich z.B. sich auf einige wenige Themen zu beschränken. Die drei bis vier Hauptthemen sollten rund 40% des Textes oder mehr einnehmen. Eines dieser Themen sollte menschliche Nähe oder Beziehung sein. Beruf und Arbeit und auch Familienleben sind gute Ideen für literarische Themen. Politik ist ein schlechtes, ebenso wie Erotik (und über diese Erkenntnis sind die Autoren wirklich sehr begeistert). Auf eine regelmäßige Spannungskurve mit vielen Hochs und Tief sollten Autoren außerdem achten. Ein als journalistisch identifizierter Schreibstil ist gut, um Bücher zu verkaufen, ein von Literaturwissenschaftlern geprägter Stil holt die großen Preise wie z.B. den Pulitzer. Ach ja und Hunde verkaufen sich besser als Katzen.

Etwas, das bei diesem Buch auch hervorsticht ist der Schreibstil. Ja, wirklich, die Autoren sind humorvoll und verstehen es außerdem, eine gewisse Spannung aufzubauen. Das Buch liest sich ziemlich gut weg und man könnte es tatsächlich sogar als Page-Turner bezeichnen. Natürlich fragt man sich permanent, ob sie ihr eigenes Buch mit Hilfe ihres Bestseller-o-meters optimiert haben und natürlich werden ihre stilistischen Analysen sie sensibilisiert haben. Mit oder ohne algorithmische Unterstützung, diese Buch liest sich einfach locker flockig weg und das ist für ein Sachbuch schon recht ungewöhnlich vor allem für ein literaturwissenschaftlich geprägtes.

Objektivität, Reliabilität, Validität

Die statistischen Methoden, die Jockers und Archer anwenden sind wohl so objektiv wie sie in einem literaturwissenschaftlichen Kontext nur sein können, aber wie verhält es sich denn nun mit den anderen in oben stehender Zwischenüberschrift erwähnten Gütekriterien der Wissenschaft? Nun, ich denke, für den Testfall Amerika, den die Autoren in ihren – ich nenn sie mal – Laborexperimenten betrachtet haben, kann man zumindest die Verlässlichkeit attestieren. Die beiden Literaturkenner haben ihr System wirklich auf Herz und Nieren geprüft und sich auch Herausforderungen gestellt. So haben sie z.B. erfolgreich das Phänomen „fifty Shades of Grey“ untersucht, das trotz des erotischen Themas in seinem Wortmaterial das Bestseller-Potential zu erkennen gegeben hat. Insgesamt kommen sie auf eine Trefferquote von 80% bei Vorhersagen unter Laborbedingungen, was schon mehr als ordentlich ist und weit über einem zufälligen 50:50 liegt. Bisher konnte noch kein unveröffentlichtes Werk als Bestseller identifiziert werden, aber einem befreundeten Autor konnten Jockers und Archer wenigstens erklären, warum sein Manuskript abgelehnt wurde und wie er es verbessern könnte. Die Zukunft wird zeigen, ob ihre Idee einer Literatur-Agentur, in der einer der Hauptmitarbeiter ein Computer ist, tatsächlich fruchtet. Ein innovativer Ansatz ist es auf jeden Fall.

Aber die Übertragbarkeit bereitet mir Sorge und somit auch die Validität der Erkenntnisse in diesem Buch. Was würde das Bestseller-o-meter z.B. mit einem Roman machen, in dem einer der Protagonisten ein kommunistisches Känguru ist und der trotzdem wochen- ja sogar monatelang auf der Spiegel Bestseller Liste ganz oben stand? Zu gern würde ich sehen, wie diese beeindruckende Studie auf andere Testumgebungen angewandt würde. An einer Stelle wird z.B. erwähnt, dass auf dem amerikanischen Markt nach Stieg Larsson schwedische Krimis erst ausgesprochen en vogue waren und dann schnell vergessen wurden. Hier zu Lande aber sind schon seit den 70er Jahren und dem Autorenduo Sjöwall/Wahlöö skandinavische Krimis anhaltend beliebt. Am Ende läuft es natürlich darauf hinaus, dass man gerne selbst einmal ein bisschen mit so einem Wunderalgorithmus (wenn es ihn denn gibt, den „Einen“) herumspielen würde. Da das in absehbarer Zeit aber nicht möglich sein wird, wird uns nichts anderes übrig bleiben als weiter zu schauen, ob Jockers und Archer noch mehr aus ihrem Kaninchenhut holen. Die digitale Literaturwissenschaft wird dieses am ehesten als populärwissenschaftliche Sachbuch einzuordnende Werk vielleicht eher am Rande wahrnehmen und sich nicht plötzlich zu einem Forschungsfeld für Bestseller wandeln. Aber trotz aller Zerrissenheit, was meine Meinung zu diesem Buch angeht, bereue ich keine Seite, die ich darin gelesen habe. Es hat nämlich schlicht und einfach Spaß gemacht!

Jodie Archer und Matthew Jockers: „Der Bestseller-Code“, erschienen im Plassen-Verlag Juli 2017. ISBN: 9783864704994 Preis: 19,99€ in der gebundenen Ausgabe.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*