Schlagwort Archiv: Tools

Tutorial: Wie ich CATMA und Stanford NER zusammen nutze

Ich gebe zu, dass wahrscheinlich 10% meiner Liebe zu dem Tool CATMA (Computer Aided Textual Markup and Analysis) nur daher stammt, dass es von meinen Kollegen in Hamburg entwickelt wird, die niemals müde zu werden scheinen, wenn Nutzer wie ich immer neue Funktionalitäten haben wollen. Aber so bleiben immer noch 90%, die daher rühren, dass dieses Programm inzwischen eine große Vielfalt an Nutzungsmöglichkeiten bietet, sodass ich immer wieder dazu zurückkehre, selbst, wenn ich mir mal vornehme, einen anderen Weg zu gehen. So geschah es also auch als ich nach Weiterverwendungsmöglichkeiten für meine NER (Named Entity Recognition – mehr darüber hier) Ergebnisse suchte. Als jetzt im neuen CATMA-Release auch noch eine Funktion zur xml Erkennung freigeschaltet wurde, wurde das Ganze sogar noch einmal einfacher.

(mehr …)

Das Känguru und ich oder ich und das Känguru

„Was an dem Buch hat Ihnen denn gefallen?“, frage ich. „Also, das Känguru fand ich echt witzig“, sagt die Frau, „aber diese andere Figur…“ „Ja?“ „…dieser Kleingärtner…“ „Kleinkünstler.“ „Ja. Der hat irgendwie genervt.“

Solche und ähnliche Dialoge streut Marc-Uwe Kling gerne einmal selbstironisch in die Fortsetzungsbände seiner Känguru-Chroniken. Doch wenn es den vielen Lesern seiner Bücher tatsächlich so ergehen würde, würden sie sich wohl kaum derartig mitreißen lassen, denn eine computergestützte Analyse zeigt, dass die Texte wohl ebenso sehr um „den Kleinkünstler“ kreisen wie um „sein“ Känguru.

In my last post, I bored you with a German text about a guy living together with a kangaroo. As the book ist still not translated into English (or to any other language), I decided not to do that again and that’s why I did not rewrite this article in English. Should there be anyone out there to whom a translation does not sound irrelevant, just drop a comment and I will start working on it. (mehr …)

Tutorial: Wie ich Stanford NER mit deutschen Classifiern installiere und nutze

Ich habe ein paar Stunden, wenn nicht gar Tage, damit verbracht, den Stanford NER (Named Entity Recognizer) zum Laufen zu bringen und das, obwohl es eigentlich ganz einfach ist. Damit euch das nicht passieren kann, schreibe ich diese Anleitung für Geisteswissenschaftler, die gerne digitale Tools nutzen möchten, sich aber noch nicht allzu viel mit Programmierung auseinandergesetzt haben. In fünf einfachen Schritten gelangst du hier also zu einem getaggten Text – auf Englisch oder Deutsch.

I spend a few hours – maybe even days – to find out how to run the Stanford NER (Named Entity Recognizer) on my computer, although it is actually very easy. As I think this is due to a dramatic lack of simple NER tutorials, I decided to write one for this blog. So this is to all the humanists who did not yet take the chance to have a closer look at programming issues and, nevertheless, want to use the Stanford NER – be it in English or in German (or others).

(mehr …)