Tools

Tutorial: Wie ich CATMA und Stanford NER zusammen nutze

Ich gebe zu, dass wahrscheinlich 10% meiner Liebe zu dem Tool CATMA (Computer Aided Textual Markup and Analysis) nur daher stammt, dass es von meinen Kollegen in Hamburg entwickelt wird, die niemals müde zu werden scheinen, wenn Nutzer wie ich immer neue Funktionalitäten haben wollen. Aber so bleiben immer noch 90%, die daher rühren, dass dieses Programm inzwischen eine große Vielfalt an Nutzungsmöglichkeiten bietet, sodass ich immer wieder dazu zurückkehre, selbst, wenn ich mir mal vornehme, einen anderen Weg zu gehen. So geschah es also auch als ich nach Weiterverwendungsmöglichkeiten für meine NER (Named Entity Recognition – mehr darüber hier) Ergebnisse suchte. Als jetzt im neuen CATMA-Release auch noch eine Funktion zur xml Erkennung freigeschaltet wurde, wurde das Ganze sogar noch einmal einfacher.

(mehr …)

Das Känguru und ich oder ich und das Känguru

„Was an dem Buch hat Ihnen denn gefallen?“, frage ich. „Also, das Känguru fand ich echt witzig“, sagt die Frau, „aber diese andere Figur…“ „Ja?“ „…dieser Kleingärtner…“ „Kleinkünstler.“ „Ja. Der hat irgendwie genervt.“

Solche und ähnliche Dialoge streut Marc-Uwe Kling gerne einmal selbstironisch in die Fortsetzungsbände seiner Känguru-Chroniken. Doch wenn es den vielen Lesern seiner Bücher tatsächlich so ergehen würde, würden sie sich wohl kaum derartig mitreißen lassen, denn eine computergestützte Analyse zeigt, dass die Texte wohl ebenso sehr um „den Kleinkünstler“ kreisen wie um „sein“ Känguru.

In my last post, I bored you with a German text about a guy living together with a kangaroo. As the book ist still not translated into English (or to any other language), I decided not to do that again and that’s why I did not rewrite this article in English. Should there be anyone out there to whom a translation does not sound irrelevant, just drop a comment and I will start working on it. (mehr …)