Schlagwort Archiv: Named Entity Recognotion

Distant Reading: Wie viel Distanz zum Text ist gesund?

In seinem Buch „Distant Reading“, dass ich vor kurzem hier vorgestellt habe, behauptet Franco Moretti bewusst provokant, es würde nichts nützen, immer mehr zu lesen. Statt dessen müssten Literaturwissenschaftler endlich die Kunst des nicht-Lesens erlernen. Dieser Satz hat mich nicht lange erschüttert und schnell begeistert. Ja, das nicht-Lesen war es, dass ich in meiner Doktorarbeit auch betreiben wollte. Jetzt habe ich ein erstes Distant-Reading Tool ausprobiert und möchte kurz zurückschauen, welche Ungenauigkeiten man in Kauf nehmen muss, wenn man damit arbeiten möchte. Dazu habe ich einen Text zuerst in einem Mittelweg zwischen Close und Distant Reading locker nebenbei gelesen und alle Ortsnamen, die mir aufgefallen sind, in eine Tabelle geschrieben. Danach habe ich den gleichen Text mit dem Stanford Named Entity Recognizer analysiert. Zu guter Letzt habe ich dann den Text noch einmal sogfältig mit CATMA getaggt. Die Ergebnisse dieses close- gegen not too close und distant reading möchte ich in diesem Post mit euch teilen.

Franco Moretti has stated in his book „Distant Reading“ that we should start to learn how not to read. Despite the provoking undertone this was a phrase that cought me directly and I definitely wanted to start learning how not to read. Now that I tried to use a first distant reading tool on  literary texts, I would like to reflect a little on the pros and cons of distant reading. Therefore I tried first to read a text rather fast and not too closely, then I let the same text be read by the Stanford Named Entity Recognizer and finally close read the text and tagged it with CATMA. Now I want to share my experiences with you.

(mehr …)

Tutorial: Wie ich Stanford NER mit deutschen Classifiern installiere und nutze

Ich habe ein paar Stunden, wenn nicht gar Tage, damit verbracht, den Stanford NER (Named Entity Recognizer) zum Laufen zu bringen und das, obwohl es eigentlich ganz einfach ist. Damit euch das nicht passieren kann, schreibe ich diese Anleitung für Geisteswissenschaftler, die gerne digitale Tools nutzen möchten, sich aber noch nicht allzu viel mit Programmierung auseinandergesetzt haben. In fünf einfachen Schritten gelangst du hier also zu einem getaggten Text – auf Englisch oder Deutsch.

I spend a few hours – maybe even days – to find out how to run the Stanford NER (Named Entity Recognizer) on my computer, although it is actually very easy. As I think this is due to a dramatic lack of simple NER tutorials, I decided to write one for this blog. So this is to all the humanists who did not yet take the chance to have a closer look at programming issues and, nevertheless, want to use the Stanford NER – be it in English or in German (or others).

(mehr …)