Bildschirmfoto 2014-09-07 um 14.06.18

Tutorial: Wie ich Stanford NER mit deutschen Classifiern installiere und nutze

Ich habe ein paar Stunden, wenn nicht gar Tage, damit verbracht, den Stanford NER (Named Entity Recognizer) zum Laufen zu bringen und das, obwohl es eigentlich ganz einfach ist. Damit euch das nicht passieren kann, schreibe ich diese Anleitung für Geisteswissenschaftler, die gerne digitale Tools nutzen möchten, sich aber noch nicht allzu viel mit Programmierung auseinandergesetzt haben. In fünf einfachen Schritten gelangst du hier also zu einem getaggten Text – auf Englisch oder Deutsch.

I spend a few hours – maybe even days – to find out how to run the Stanford NER (Named Entity Recognizer) on my computer, although it is actually very easy. As I think this is due to a dramatic lack of simple NER tutorials, I decided to write one for this blog. So this is to all the humanists who did not yet take the chance to have a closer look at programming issues and, nevertheless, want to use the Stanford NER – be it in English or in German (or others).

Weiterlesen

digital-humanities-logo_1

DHd 2015 Konferenz: Call for papers ist da

Ich habe dem gestrigen Tag ja schon richtig ein bisschen entgegen gefiebert, denn es sollte der Tag werden, an dem der Call for Papers für die DHd Konferenz 2015 veröffentlicht wird. Gesagt, getan, der Call ist da und ich muss sagen: Ich liebe das Thema. Nächstes Frühjar in Graz werden wird uns alle von Daten zu Erkenntnissen bewegen und Mittler zwischen Information und Interpretation werden. Ich werde dabei sein und bin höchst gespannt, was ihr so präsentieren werdet.I really looked forward to Septembre 1rst this year, because I knew that would be the day that the call for papers for the DHd conference 2015 would be published. Now that the call is out, I am even more excited because I really love the subject they chose: From Data to isights; how Digital Humanists mediate between information and interpretation. I definitely will be there and I hope so will you.

Wordcloud des Book of Abstracts der DH 2012

Sind wir alle ein bisschen Google?

Die digitalen Geisteswissenschaften haben hierzulande den Einzug in die Tagespresse geschafft – das ist toll. Nein wirklich, ich habe mich sehr gefreut, als ich von einem Freund darauf hingewiesen wurde, dass in der aktuellen Ausgabe der Wochenzeitung „Die Zeit“ ein Artikel zum Thema Digital Humanities veröffentlicht wurde; und das nicht nur des plötzlich aufkeimenden irrationalen Stolzes wegen, der mich erfüllte als meine Kollegin darin erwähnt wurde. Es ist ein guter Artikel, der allgemein verständlich darlegt, was wir hier so machen. Dass mal wieder ein Fokus auf der Computerlinguistik liegt, kann man kaum verdenken, da das doch auch innerhalb der Community ein ständig wiederkehrendes „Problem“ ist.

Digital Humanities have made their way into a popular German newspaper – that’s great. I was really happy when I heard from a friend that the newspaper „Die Zeit“ has recently published an article on DH, and that is not only because I became a little proud, when I saw that my dear colleague was quoted. It is a good article that shows what Digital Humanities is about in a way that is very well understandable for people never having heard about this topic before. But, I must admid that I have troubles with a statement in that article saying that Digital Humanities are also called „Culturomics“.

Weiterlesen

Bildschirmfoto 2014-08-09 um 15.05.42

Meine erste Kartenvisualisierung

Okay, sie lässt inhaltlich noch sehr zu wünschen übrig, aber wenn man so seine allererste Visualisierung vor sich hat, kann man seinen Stolz einfach nicht zurück halten und so muss ich euch heute die meine präsentieren. Was ihr seht ist ein Korpus von rund 30 Hamburgromanen nach Genres. Auf einer zweiten Ebene entfalten sich die ersten 50 Seiten von einem dieser Romane. Man sieht: Ein „St. Pauli Krimi“ ist stets mehr als das.

I did it. My first map visualization is online. I see it is not perfect yet especially on the content side, but I am so proud, I absolutely have to share it with you today. What you see is the metadata of approximately 30 novels from Hamburg. They are connected to the areas of the city they are set in and tagged by genre. On a second layer you see the named places on the first 50 pages of one of those novels. In the end what is called a „St. Pauli“ novel seems to be much more than that.

Vergessen

Der Zauber des Vergessens

Manchmal gibt es Themen, die auf einmal von allen Seiten auf einen zukommen, obwohl sie einem zuvor noch nie Kopfzerbrechen bereitet haben. Eines dieser Themen ist für mich im Moment das Vergessen. Schon bevor der europäische Gerichtshof gegenüber Google durchgesetzte, dass man das Recht darauf hat, vergessen zu werden, habe ich mich im Rahmen meiner Arbeit für das Datenbankprojekt efoto-hamburg, gefragt, welchen Stellenwert das Vergessen eigentlich hat und haben sollte. Schließlich kam das Thema dann auch bei einer Diskussion unter Kollegen des DARIAH Projektes kurz auf. Ohne dass sich mir ganz erschließt wieso, scheint das Vergessen oder eben auch sein Gegenteil, ein stark emotional besetztes Phänomen zu sein. Grund genug, einmal genauer darüber nachzudenken.

Vergessen
Was erinnert die Welt eigentlich von mir? Schnell mal self-googling betreiben und du wirst es erfahren.

Manchmal gibt es Themen, die auf einmal von allen Seiten auf einen zukommen, obwohl sie einem zuvor noch nie Kopfzerbrechen bereitet haben. Eines dieser Themen ist für mich im Moment das Vergessen. Schon bevor der europäische Gerichtshof gegenüber Google durchgesetzte, dass man das Recht darauf hat, vergessen zu werden, habe ich mich im Rahmen meiner Arbeit für das Datenbankprojekt efoto-hamburg, gefragt, welchen Stellenwert das Vergessen eigentlich hat und haben sollte. Schließlich kam das Thema dann auch bei einer Diskussion unter Kollegen des DARIAH Projektes kurz auf. Ohne dass sich mir ganz erschließt wieso, scheint das Vergessen oder eben auch sein Gegenteil, ein stark emotional besetztes Phänomen zu sein. Grund genug, einmal genauer darüber nachzudenken.

Weiterlesen

Weil wir es können – Ideen zu Matthew L. Jockers‘ „Macroanalysis“

20140501-193251.jpgVor kurzem fragte ein Digital Humanist über den Humanists Listserver, welche zwei Bücher man empfehlen könne, um einen Überblick über das zu geben, was die digitalen Geisteswissenschaften in der Analyse von Literatur leisten können. Ein Kollege empfahl „Macroanalysis“ von Matthew L. Jockers, ein Buch, das auch schon seit ein paar Tagen auf meinem Couchtisch bereit lag. Nun, da ich es durchgelesen habe, bin ich gleichzeitig angetan und enttäuscht. Jockers entfacht zwar ein ganzes Feuerwerk von Methoden, antwortet aber nur selten auf die Frage, was wir am Ende eigentlich wissen, wenn wir fleißig möglichst große Ergebniskonvolute gesammelt und ausgewertet haben.

Weiterlesen

Lektüre: Franco Morettis „Distant Reading“ von Nahem

Verso 978 1 78168 084 1 Distant Reading (CMYK-300dpi)Wenn es einen Nobelpreis für Literaturwissenschaftler gäbe, so hätte Franco Moretti ihn schon allein dafür verdient, den Begriff des „Distant Reading“ eingeführt zu haben. Doch obwohl dies der innovativste methodische Ansatz ist, den die Literaturwissenschaft im Moment vorzuweisen hat, zeigt Moretti auch, dass hier gerade die ersten Gehversuche in einem Feld gemacht werden, das noch nicht klar konturiert ist und dessen wissenschaftliche Parameter noch auf dem Prüfstand stehen. In seinem neuen Buch „Distant Reading“ hat er all die Aufsätze zusammengestellt, die zur Prägung des Begriffes führten und die genau diese ersten Gehversuche dokumentieren. Damit gelingt es ihm gleichzeitig, seine Leser zu begeistern und zum kritischen Überprüfen der Methode anzuregen.

Weiterlesen

DHd Pre-Konferenz-Workshop zum wissenschaftlichen Bloggen

DHd Konferenz 2014Dieser Workshop hat für mich vor allem eines verändert: Den Blick auf das wissenschaftliche Bloggen als standardisierte und etablierte forschungsbegleitende Maßnahme. Ja, ich war mir schon bewusst, dass längst noch nicht alle Wissenschaftler bloggen, aber ich hätte doch gedacht, dass zumindst viele im Rahmen von Veranstaltungswebseiten oder Ähnlichem das Bloggen bereits erlernt hätten. So war ich dann auch gar nicht darauf eingestellt, dass dieser Workshop eher eine intensive Hands-on Session zum Thema WordPress sein würde als ein Austausch über Erfahrungen mit dem wissenschaftlichen Bloggen. Nur zu Beginn ging es darum, Blogprojekte von de.Hypothesis.org vorzustellen und Vor- und Nachteile des Bloggens innerhalb der bestehenden wissenschaftlichen Community abzuwägen. So wurden die Teilnehmer am Ende mit vielen erleichterten A-has über die Einfachheit der Technik und einem großen Fragezeichen bezüglich der Gestaltung der Inhalte zurückgelassen.

DHd Konferenz 2014Dieser Workshop hat für mich vor allem eines verändert: Den Blick auf das wissenschaftliche Bloggen als standardisierte und etablierte forschungsbegleitende Maßnahme. Ja, ich war mir schon bewusst, dass längst noch nicht alle Wissenschaftler bloggen, aber ich hätte doch gedacht, dass zumindst viele im Rahmen von Veranstaltungswebseiten oder Ähnlichem das Bloggen bereits erlernt hätten. So war ich dann auch gar nicht darauf eingestellt, dass dieser Workshop eher eine intensive Hands-on Session zum Thema WordPress sein würde als ein Austausch über Erfahrungen mit dem wissenschaftlichen Bloggen. Nur zu Beginn ging es darum, Blogprojekte von de.Hypothesis.org vorzustellen und Vor- und Nachteile des Bloggens innerhalb der bestehenden wissenschaftlichen Community abzuwägen. So wurden die Teilnehmer am Ende mit vielen erleichterten A-has über die Einfachheit der Technik und einem großen Fragezeichen bezüglich der Gestaltung der Inhalte zurückgelassen.

Weiterlesen

DHd Pre-Konferenz Workshop zum Thema GeoHumanities

20140411-135834.jpgGeoHumanities sind zur Zeit voll im Trend. Spätestens seit dem Spatial Turn in den 1970er Jahren suchen wir ja alle irgendwie nach der wahrhaftigen Beschaffenheit des Raumes. Doch, ob die schönen Techniken der Datenaufbereitung und -visualisierung uns dieser Erkenntnis tatsächlich ein Stück näher bringen, konnte auch dieser Workshp nicht abschließend klären. Dafür wurden allerdings viele Ideen und Ansätze zu gemeinsamem Umdenken präsentiert. Geologen, Informatiker, Linguisten und Archäologen zeigten Methoden und sogar schon erste Ergebnisse der Arbeit mit Georefenzierung. Doch bei aller Begeisterung über die neuen Möglichkeiten blieb doch die eine große Verunsicherung am Ende stehen: Wie soll mit Unschärfen, Ambiguität und mehrdeutigen Datensätzen umgegangen werden? Und wie ich mich so umsehe, steigt in mir selber leise die Frage auf, wo eigentlich meine Kollegen aus der Literaturwissenschaft sind, wenn es um GeoHumanities geht und warum diese Spezialisten für unscharfe Daten sich noch nicht mit den Spezialisten in puncto Raumwissenschaft zusammengetan haben.

20140411-135834.jpgGeoHumanities sind zur Zeit voll im Trend. Spätestens seit dem Spatial Turn in den 1970er Jahren suchen wir ja alle irgendwie nach der wahrhaftigen Beschaffenheit des Raumes. Doch, ob die schönen Techniken der Datenaufbereitung und -visualisierung uns dieser Erkenntnis tatsächlich ein Stück näher bringen, konnte auch dieser Workshp nicht abschließend klären. Dafür wurden allerdings viele Ideen und Ansätze zu gemeinsamem Umdenken präsentiert. Geologen, Informatiker, Linguisten und Archäologen zeigten Methoden und sogar schon erste Ergebnisse der Arbeit mit Georefenzierung. Doch bei aller Begeisterung über die neuen Möglichkeiten blieb doch die eine große Verunsicherung am Ende stehen: Wie soll mit Unschärfen, Ambiguität und mehrdeutigen Datensätzen umgegangen werden? Und wie ich mich so umsehe, steigt in mir selber leise die Frage auf, wo eigentlich meine Kollegen aus der Literaturwissenschaft sind, wenn es um GeoHumanities geht und warum diese Spezialisten für unscharfe Daten sich noch nicht mit den Spezialisten in puncto Raumwissenschaft zusammengetan haben.

Weiterlesen

Dieser Blog

Auf diesem Blog werdet ihr meinen Weg vom MA zum Dr. miterleben können. Ich werde Themengebiete wie Digital Humanities, Distant Reading und Big Data in den Geisteswissenschaften erkunden und lege meine Ideen zur kulturellen Prägung urbaner Räume durch Literatur offen. Doch dieser Blog soll mehr sein als bloß noch ein Dissertationsblog. Darum werde ich auch Neuerscheinungen wissenschaftlicher Publikationen rezensieren und Veranstaltungen kommentieren. Ich freue mich auf eure Anregungen, Kommentare und Diskussionsbeiträge. Text- und Bildrechte liegen – wenn nicht anders gekennzeichnet – bei mir und Inhalte dürfen gerne geliked, geshared oder gerebloggt werden, solange die ursprüngliche Quelle genannt wird.I write this blog to let you take part in my doctoral studies. The focus will be on Digital Humanities, Distant Reading and using Big Data methods in humanities. I especially want to share my findings concerning the cultural creation of urban spaces in literature. However, it shall be more than just another blog about a doctoral dissertation. That’s why I will also publish reviews and personal perspectives on recent publications in the field of Digital Humanities and Literary Theory and I will comment on conferences, workshops and other events I visit. I am looking forward to receive your comments and suggestions!

Texts and pictures – when not labelled otherwise – are my own and may be used, liked and shared as long as the original source is named.