Das Känguru und ich oder ich und das Känguru

„Was an dem Buch hat Ihnen denn gefallen?“, frage ich. „Also, das Känguru fand ich echt witzig“, sagt die Frau, „aber diese andere Figur…“ „Ja?“ „…dieser Kleingärtner…“ „Kleinkünstler.“ „Ja. Der hat irgendwie genervt.“

Solche und ähnliche Dialoge streut Marc-Uwe Kling gerne einmal selbstironisch in die Fortsetzungsbände seiner Känguru-Chroniken. Doch wenn es den vielen Lesern seiner Bücher tatsächlich so ergehen würde, würden sie sich wohl kaum derartig mitreißen lassen, denn eine computergestützte Analyse zeigt, dass die Texte wohl ebenso sehr um „den Kleinkünstler“ kreisen wie um „sein“ Känguru.

In my last post, I bored you with a German text about a guy living together with a kangaroo. As the book ist still not translated into English (or to any other language), I decided not to do that again and that’s why I did not rewrite this article in English. Should there be anyone out there to whom a translation does not sound irrelevant, just drop a comment and I will start working on it.

„ich“, „das“, „und“, „känguru“

Vorweg sei kurz gesagt, dass alle Berechnungen hier mit Hilfe von R Studio und Matthew Jockers‘ Einleitung Text Analysis with R for Students of Literature gemacht wurden, ein Buch, das ich allen empfehlen kann, die gerne mehr über R lernen möchten oder die noch gar nichts darüber wissen und den Einstieg wagen wollen.

Die erste Analyse, die Aufschluss darüber gibt, worum es im Känguru-Manifest geht, ist eine simple Abfrage der 10 häufigsten Wörter. Diese sind in absteigender Reihenfolge: ich, das, und, känguru, die, der, sagt, es, in, ist. Bemerkenswert ist das vor allem, wenn man diese 10 Wörter mit den 10 häufigsten Wörtern in anderen Romanen vergleicht. Diese enthalten nämlich selten signifikante Begriffe und beschränken sich meist auf Funktionswörter. Vielleicht ist auch mal der Name eines Protagonisten darunter. Hier aber bekommen wir gleich die wichtigsten Phrasen mitserviert, die mit großer Wahrscheinlichkeit lauten: „Ich und das Känguru“ und „sagt das Känguru“ bzw. „sagt es“. Außerdem kann man vermuten, dass viel wörtliche Rede vorkommt, innerhalb derer Selbstaussagen vorkommen und die dann mit „sagt…“ schließen.

Am meisten aber springen Zahlen ins Auge, die ich euch bisher vorenthalten habe. ich kommt mit 1962 Vorkommnissen nämlich rund doppelt so häufig vor wie känguru (1164):

Verteilung_ich_känguruSchwarz hier der Gebrauch des Wortes ich im Verlauf des Textes.

Die Verteilung für das Wort känguru ist ähnlich, wenn auch nicht ganz so schwarz:

Verteilung_Känguru_K-ManifestUnd das obwohl vor allem im hier untersuchten zweiten Teil der Känguru-Chroniken immer stärker betont wird, dass eine Pro- vs. Antagonisten Konstellation angestrebt wird, die das Känguru und seinen Nachbarn den Pinguin ins Zentrum des Geschehens rückt. Ein kurzer Blick auf eine dritte Garfik zeigt, dass Letzterer allerdings für eine solch klassische Konstellation wesentlich zu kurz kommt:

K_I_P_Raw_FrequencyIst das Känguru mit den Boxhandschuhen nur ein niedlicherer Schweinehund?

Ich stelle mir vor, ich würde den Inhalt des Buches nicht kennen und hätte statt dessen nur dieses Zahlenmaterial vor mir. Ich denke, ich ließe mich wohlmöglich von diesen Ergebnissen schnell dazu hinreißen, eine textimmanente, psychologische bis psychoanalytische Interpretation zu beginnen, nach der das Känguru eine Spiegelfigur des Protagonisten ist. In Wahrheit ginge es hier nicht um das sprechende Tier, sondern vielmehr um dessen manchmal unscheinbar wirkenden Mitbewohner. Weiter würde ich vielleicht vermuten, dass das Känguru wahlweise eine unbewusste oder überbewusste Facette des Ichs des Erzählers sei, die immer das ausspreche, was der eigentliche Protagonist nicht auszusprechen wagt oder aber immer für dessen Scherze mit seinen Mitmenschen verantwortlich gemacht würde.

All diese aufgrund der reinen Zahlen möglichen Annahmen zeigen vor allem, dass es selbst beim Distant Reading wichtig ist, dem Text näher zu kommen als man es mit rein quantitativen Analysen kann. Ich habe darum das Wort ich abschließend noch in einer Tabelle als Keyword in Context angeschaut und auch ohne alle rund 1960 Vorkommnisse durchzusehen, wurde mir schnell klar, dass allzu kurz geschlossene Einsichten relativiert werden müssen. Durch die hohe Dialogizität zwischen Erzähler und Känguru, verteilt sich die Verwendung des Wortes ich auf beide Figuren. Somit nimmt das Känguru sowohl diese Bezeichnung als auch einen guten Teil der Vorkommnisse des Wortes ich für sich ein. Hinzu kommt, dass zusätzlich höchstwahrscheinlich alle Vorkommnisse des Wortes es dem Känguru zugeordnet werden können. Und so werden zwei Dinge aus diesen Fundstücken klar:

  1. Aufgrund einer reinen Prüfung von Wortvorkommnissen kann man einem Erzähltext nicht besonders nahe kommen. Auch Listen eines einzelnen Keyword in Contexts bringen einen lediglich dazu, die gefundenen Auffälligkeiten wieder zu relativieren.
  2. Eine solche statistische Auswertung kann ziemlich klar widerlegen, dass es sich – wie vordergründig behauptet – um eine Protagonisten-Antagonisten Konstellation handelt. Traurig aber wahr, der Pinguin spielt in Wahrheit eine ziemlich kleine Rolle. Dafür gibt es eine recht eindeutige Aufteilung der Protagonistenrolle in diesem Roman, die allerdings dadurch verschleiert wird, dass eine Figur als bedeutsamer hervorgehoben wird. Fans des Pinguin sei allerdings die Hoffnung auf den nächsten Band erlaubt, denn wie die dritte Grafik zeigt, gibt es am Ende einen kleinen Aufwärtstrend, was die Erwähnung des kühlen Nachbarn angeht.

Das Alles wiederlegt jetzt natürlich nicht die Interpretationsansätze, die ich weiter oben skizziert habe. Es zeigt allerdings, das eine solche erst verbindlich belegt werden könnte, wenn man näher in den Text hinein geht als man das mit sehr simplen statistischen Auswrtungen tun kann. Insgesamt führt mich das also wieder zur Frage einer meiner letzten Artikel zurück, wie viel Distanz man beim Distant Reading zum Text entwickeln sollte, um sowohl einen umfassenden Überblick über einen oder mehrere Text/e zu bekommen als auch belastbare Interpretationen leisten zu können. Es lässt mich Skepsis gegenüber einzelnen Methoden entwickeln und vor allem der abschließende Blick in die KWIC-Tabelle lässt mich dahin tendieren, unterschiedliche Methoden miteinander zu kombinieren – seien diese nun auf Quantität oder Qualität fokussiert.

Wer umschreibt, der bleibt – und bekommt die Trophäe für den reichsten Wortscahtz

Eine letzte kleine Erkenntnis möchte ich euch nicht vorenthalten, da sie es mir besonders angetan hat. Eine Abfrage der größten Vorkomnisse von Hapax Legomena (nur einmal verwendete Wörter) in den einzelnen Kapiteln lenkt das Augenmerk auf ein kleines aber feines Kapitel mit dem offensichtlich reichsten Wortschatz (bei einem kurzen Kapitel wie diesem ist es allerdings auch leichter, möglichst viele Wörter nur einmal zu verwenden – auch hier kommt die Erkentnis also nicht ohne Relativierung).

Es handelt sich um ein Kapitel, in dem die Protagonisten sich darüber begeistern, dass Versender von Spam Nachrichten beim Ersinnen ihrer Betreffzeilen immer kreativer werden, um so den Spamfiltern zu entgehen. In diesem Kapitel, das übrigens „wer umschreibt, der bleibt“ heißt, steigern sich Känguru und Mitbewohner in das Erfinden neuer Betreffs hinein, die von

Beim Vollzug des Beischlafes die Gemahlin durch gesteigerte Manneskraft betören

bis

Nicht mehr bleibest du umfangen

In der Finsternis Beschattung,

Und dich reißet neu Verlangen

Auf zu höherer Begattung

gehen. Und so endet das Kapitel mit dem reichsten Wortschatz mit Worten des wortreichsten deutschen Dichters. Herrlich!

Digital Humanities transparent betreiben

Schließen möchte ich diese Ausführungen mit der Einschätzung, dass Digital Humanities Methoden keineswegs die Black Box oder die Magie sein sollten als die sie nicht selten mystifiziert werden. Distant Reading Techniken werden – so wie ich dies einschätze – nicht dazu führen, dass immer weniger selbst bzw. von Menschen gelesen wird. Viele mit Digital Humanities Tools generierbare Daten sind schlicht nicht qualitativ und richtig interpretierbar, wenn man nicht zumindest ab und zu in den Text hineingeht oder diesen bereits kennt. Ist dieses Fallbeispiel auch eher klein und witzig, so bestärkt es mich doch in meiner Ahnung davon, dass ein Mittelweg zwischen Close und Distant Reading gefunden werden muss, um die bestmöglichen Ergebnisse aus Digital Humanities Methoden herauszubekommen.

Alle hier angeführten Zitate sind aus:

Kling, Marc-Uwe: Das Känguru-Manifest. Ullstein 2011.

Beim letzten handelt es sich nicht um den Betreff einer Spammail nicht jugendfreien Inhalts, sondern – wie ihr vielleicht bemerkt habt – um die dritte Strophe von Goethes Gedicht „Selige Sehnsucht“ aus dem fernöstlichen Divan.

Kommentar verfassen