Digitale Perspektiven mediävistischer Quellenrecherche

 

Zusammenfassung: Forschern in den Geisteswissenschaften stehen immer mehr digitalisierte Volltexte zur Verfügung. Daraus ergeben sich Chancen, neue Fragestellungen werden möglich, deren Beantwortung wiederum neue Perspektiven eröffnet, aber auch Herausforderungen schafft. In diesem Aufsatz wird versucht, diese Probleme einzugrenzen und neue Möglichkeiten für die Arbeit mit Volltexten in den Geisteswissenschaften mit einem Fokus auf die Mediävistik zu skizzieren.

Nutzerverhalten — Nutzerperspektiven

Der Zugang, den ein Forscher im Hinblick auf eine Fragestellung in der Mediävistik wählt, formt sich zumeist erst in der intensiven und direkten Auseinandersetzung mit den Quellen. Das Spektrum der Auseinandersetzung reicht dabei vom Studium und der Transskription des Originals hin zur Benutzung von Editionen oder Regestenwerken. Letztendlich aber stellt der Forscher meist engen Kontakt zu den Quellen her, indem er sie deutet, einordnet und mit den aus ihnen geschöpften Aussagen arbeitet. Zusammenfassende und erschließende Hilfsmittel bei Regesten- und Editionswerken sind, soweit vorhanden, Personen-, Orts- und Sachregister. Seit den 1990er Jahren gab es erste Anstrengungen maßgebliche Quellenbestände, Editionen und Regestenwerke im Volltext im Internet für die Recherche zur Verfügung zu stellen. Die zunehmende Verfügbarkeit der Volltexte änderte auch langsam die Herangehensweise an die Quellen: Die Volltextsuche ergänzte zunächst das gesamthafte Selbststudium aller für eine wissenschaftliche Fragestellung relevanten Quellen. Im Laufe der Zeit verschoben sich die Arbeitsschwerpunkte vom Studium der Einzelquellen hin zu Suchanfragen über die Volltextsuche. Damit einher geht der zunehmende Verlust des direkten Kontakts zur Quelle oder ihrer bearbeiteten Fassung in einer Edition. Das bedeutet bei den heutigen Studenten (und damit auch den zukünftigen Geschichtswissenschaftlern), dass sie eine Quelle in ihrer ursprünglichen Form sowie ihren Repräsentationen in einer Editionen immer weniger wahrnehmen da sie das Original oder die Editionsbände kaum noch zur Hand nehmen. Sie beschäftigen sich vielmehr mit Suchergebnissen, die ihren ursprünglichen Kontext der Quelle kaum noch deutlich werden lassen.

Andererseits können die neuen Möglichkeiten sie aber auch in die Lage versetzen, wesentlich größere Datenbestände gemeinsam zu durchsuchen und damit Fragestellungen aufzuwerfen, deren Behandlung einem Wissenschaftler unter den traditionellen „analogen“ Rahmenbedingungen allein auf Grund seiner beschränkten Lebenszeit und seines begrenzten Auffassungsvermögens gar nicht möglich war. Dies wird ohne Zweifel mittelfristig zu einem Perspektivenwechsel innerhalb der Geschichtswissenschaften führen, da neue Fragestellungen zu viel größer bemessene Quellenbestände möglich werden. So interessant die neuen Möglichkeiten für die Geschichtswissenschaften auch sein mögen, sind vor ihrer allgemeinen Akzeptanz doch noch methodische und qualitative Fragen zu klären.

Suchinterfaces — Ergebnisdarstellung: Nutzerperspektiven

Vergleich von CIN (concrete information need) und POIN (problem-oriented information need) Suchansätzen. Vergleich von CIN (concrete information need) und POIN (problem-oriented information need) Suchansätzen.

Geht man zunächst vom Nutzer einer Suchmaschine aus, wird in den Fachwissenschaften zwischen CIN (concrete information need) und POIN (problem-oriented information need) unterschieden.1 In der Tabelle werden die beiden Ansätze auf einen fiktiven Nutzer der Regesta Imperii projiziert.2 Als kurze Erläuterung für die Tabelle hier noch zwei Beispiele: Eine Suchanfrage im Sinne von CIN ist z. B. die Suche nach einem Regest, wobei dem Nutzer Band und Regestennummer bekannt sind. Eine POIN-Suche würde z.B. die Verteilung von Nennungen der Kurfürsten in den Regesten Kaiser Friedrichs III. umfassen. Diese Kategorisierungen beschreiben nicht vollständig alle Suchstrategien der Nutzer der Regesta Imperii Online, bilden aber zwei größere Nutzergruppen ab, deren Perspektiven in den folgenden Betrachtungen berücksichtigt werden sollen.

Beispiele zu Suchinterfaces von mediävistischen Quellenportalen

Den Zugang zu digitalen Quellen im Bereich Mediävistik gewähren unter anderem die Suchinterfaces von Editions- und Regestenprojekten. In einem ersten Schritt werden daher exemplarisch die Suchmasken von vier verschiedenen Projekten untersucht und verglichen.3 . In einem zweiten Schritt werden die Funktionen für die Anzeige der Ergebnisse näher betrachtet.

Expertensuche der Regesta Imperii Online (www.regesta-imperii.de). Expertensuche der Regesta Imperii Online (www.regesta-imperii.de).

Regesta Imperii

Die Online-Regestensuche der Regesta Imperii Online zeigt zunächst nur einen einfachen Suchschlitz an, um dem allgemeinen Nutzer einen möglichst flachen Einstieg zu ermöglichen. Die Expertensuche bietet dagegen wesentlich mehr Möglichkeiten, die Suche weiter einzuschränken und ermöglicht es, die Treffermenge auf ein zu bewältigendes Maß zu reduzieren. Inbesondere können flexibel mehrere Stichworte mit und/oder/nicht als Phrase oder auch als Ausstellungsort gesucht werden. Als Einstieg steht an prominenter Stelle eine umfangreiche Hilfeseite zur Verfügung. 

Papstregesten

Ähnlich strukturiert zeigt sich die Expertensuche des Göttinger Akademienprojekts zu den mittelalterlichen Papsturkunden. Es vereint eine einfache Suche und die Expertensuche auf einer Seite. Bis zu vier und/oder/und nicht-Verknüpfungen von Stichworten verschiedener Kategorien sind möglich.

Das Suchinterface des Göttinger Papsturkundenprojekts (www.papsturkunden.de).Das Suchinterface des Göttinger Papsturkundenprojekts (www.papsturkunden.de).

Die Freitextsuche muss erst explizit in der Suchkategorisierung angewählt werden, voreingestellt sind Person, Ort etc. Zudem kann man die Suche trunkieren oder nach bestimmten Datumsangaben suchen, wobei aber zwingend ein Suchwort anzugeben ist. Eine kurze Erläuterung am Fuß der Seite gibt Hinweise zu den Suchformaten für Trunkierung oder Datumseinschränkungen, wobei sich letztere allerdings nicht sehr leicht erschließen. Zweifelos von Vorteil sind die zahlreichen durchsuchbaren Kategorien, die auf eine gut strukturierte Datengrundlage schließen lassen4 Interessant wäre hier in jedem Fall die Darstellung der kategorisierenden Begriffe, um dem Nutzer einen Überblick zu den vorkommenden Orten, Personenkreisen etc. zu bieten.

dMGH

Das Suchinterface der MGH (www.dmgh.de).Das Suchinterface der MGH (www.dmgh.de).

Das Suchinterface der dMGH bietet nur ein Suchfeld für Stichwörter aber dieses bringt interessante Funktionalitäten mit sich: Es liefert eine Vorschau auf mögliche Stichwörter und bietet dem Nutzer Einblicke in die vorhandenen Stichwortlisten. Diese Funktion zeigt dem Nutzer vorkommende Schreibformen an und sensibilisiert ihn für die Stärken und Schwächen einer Volltextsuche. Auf den Hilfeseiten werden die nicht direkt aus dem Suchformular heraus erkennbaren Suchfunktionen erklärt.

Das Suchinterface der Deutschen Inschriften (www.inschriften.net).Das Suchinterface der Deutschen Inschriften (www.inschriften.net).

Deutsche Inschriften Online

Unter www.inschriften.net findet man den Internetauftritt des Akademienprojekts “Die Deutsche Inschriften”. Das Projekt bietet einen Google-Suchschlitz und auch eine Expertensuche, die nach Bänden, Zeiträumen etc. einschränken kann. Besonders gelungen sind auf dieser Seite die Tipps zur Suche, die informativ und kurz über die Suchmöglichkeiten informieren. So kann man z. B. mit Hilfe der Strg-Taste mehrere Bände auswählen und damit verbunden einen Zeitraum nach Treffern absuchen.

Zusammenfassung der Ergebnisse. Zusammenfassung der Ergebnisse.

 

In der nebenstehenden Tabelle sind nochmal die verschiedenen Suchmöglichkeiten der Seiten zusammengestellt. Einige Suchmöglichkeiten sind bei allen Projekten gleich, andere sind jeweils auf die Eigenschaften des präsentierten Materials zugeschnitten und spiegeln die Struktur der zugrundeliegenden Daten wider. Alle Suchinterfaces bringen einen Nutzer, der sich mit dem Material auskennt, sehr schnell dem gewünschten Ziel näher. Zusammengefasst kommen hier Experten mit CIN-Anfragen sehr schnell zum Ziel.

 

Ergebnisdarstellung

Ergebnisanzeige der Regesta ImperiiErgebnisanzeige der Regesta Imperii

Anders sieht dies für Benutzer mit POIN-Anfragen aus. Im Gegensatz zu CIN-Nutzern können oder wollen sie das durchsuchte Material nicht zu stark eingrenzen, da sie einen Überblick zu den Treffern ihrer Suchanfrage erhalten möchten. Für POIN-Anfragen spielt also die Anzeige der Trefferliste eine wichtige Rolle.

Regesta Imperii:  Die Regesta Imperii Online bieten bei der Ergebnisanzeige die Möglichkeit nach Datum, Herrschername und Regestennummer aufsteigend und absteigend zu sortieren. Die Zahl der pro Seite angezeigten Treffer kann auf 10, 20, 50 und 100 Treffer eingeschränkt werden. Zusätzlich wird die Ergebnisliste per Voreinstellung auf die 10.000 relevantesten Treffer beschränkt.5  Große Treffermengen lassen sich über die o.a. Möglichkeiten hinaus nicht weiter strukturieren.

Die Trefferanzeige der Papsturkunden.Die Trefferanzeige der Papsturkunden.

Papsturkunden: Die Ergebnisse im Göttinger Papsturkunden-Projekt werden in einer zweispaltigen Liste angezeigt, deren Sortierung sich nicht sofort erschließt. Nach meinem bisherige Kenntnisstand lässt sich die Reihung nicht beeinflussen. Große Treffermengen lassen sich hier nur schwer verarbeiten.

dMGH: Die dMGH bieten bei der Trefferliste die Möglichkeit nach Relevanz, Jahr, Titel und Band/Sortierschlüssel auf- und absteigend zu listen und zeigt schlussendlich das jeweilige Druckbild der Trefferseite an.6 Darüber hinaus kann die Ergebnisliste per Facettierung eingeschränkt werden. Außerdem bieten die Angaben zu den einzelnen Facetten erste Hinweise auf die zeitliche, räumliche und inhaltliche Verteilung.

Ergebnisanzeige der dMGH mit Facettierungen rechts.Ergebnisanzeige der dMGH mit Facettierungen rechts.

Im einzelnen werden als Facetten angeboten:

  • Abteilung (Treffervorkommen in den Abteilungen der MGH)
  • Reihe (Treffervorkommen in den Reihen der MGH)
  • Autor/Herausgeber
  • Jahr (Treffer pro Jahr) Erscheinungsjahr des Bandes
  • Automatische Personenerkennung (Liste der vorkommenden Personen nach Häufigkeit)
  • Automatisch Ortserkennung (Deutsch) (Liste der Orte nach Häufigkeit)

Die Durchsicht der automatisch erkannten Personen- und Ortsnamen brachte zwar einige Fehler, ist an sich aber ein interessantes Hilfsmittel.

Trefferdarstellung  der Deutschen Inschriften (www.inschriften.net).Trefferdarstellung der Deutschen Inschriften (www.inschriften.net).

Deutsche Inschriften: Bei den Deutschen Inschriften gibt es in der Expertensuche die Möglichkeit die Anzeige der Treffer nach Datum, Landkreis/Stadt und Standort, auch in verschiedenen Kombinationen, zu sortieren. Die Treffenanzeige selbst lässt sich nicht weiter beeinflussen und bietet bei großen Treffermengen keine Möglichkeiten der Ergebnisstrukturierung.

Ergebnis:  Werden die Suchkriterien so gewählt, dass im Anschluss die Trefferliste nicht zu groß wird, sind alle Seiten gut nutzbar. Nutzer mit CIN-Anfragen bekommen in kürzester Zeit Ergebnisse, mit denen sie weiter arbeiten können. Nutzer mit POIN-Anfragen haben es dagegen deutlich schwerer aus größeren Treffermengen Strukturen und Ansätze für die Fokussierung auf ihre Fragestellung herauszulesen. Lediglich bei den dMGH werden interessante Facettierungsansätze und auch die automatische Identifizierung von Personen und Orten gezeigt, deren Ausbau im Hinblick auf geographische und grafische Darstellung wünschenwert wäre.

Mehrfach-Facettierendes Suchinterface – der Spaziergang durch den Informationsdschungel

Beispiel für eine facettierte Trefferanzeige (http://www.e-codices.unifr.ch/de)Beispiel für eine facettierte Trefferanzeige (http://www.e-codices.unifr.ch/de)

Datenbankbasierte Facettierungen:  Facettierte Suchinterfaces finden heute in den Onlineshops Anwendung und bieten dem Nutzer die Möglichkeit, große Treffermengen nach vorgegebenen Kriterien einzugrenzen. Dabei werden Facettierungen angeboten, die in der Regel in der zu Grunde liegenden Datenbank bereits vorhanden sind, wie z.B. der Preis des Produkts, Hersteller etc. Als Beispiel für die Implementierung einer facettierten Ergebnisanzeige ist in der Abbildung links die Seite http://www.e-codices.unifr.ch/de dargestellt, auf der am rechten Rand die Suchergebnisse einzelnen Facetten zeitlicher und inhaltlicher Art zugeordnet werden. Dieser Ansatz für die Trefferanzeige wäre für Nutzer mit POIN-Anfragen interessant, da hier eine große Treffermenge nicht abschreckt sondern auch überblicksartig den Blick aus anderen Perspektiven eröffnet. Für die Regesta Imperii wären als Facettierungsmöglichkeiten z. B. die Datumsangaben der Regesten, die Ausstellung inkl. Geo-Koordinaten und die Verteilung auf die verschiedenen Bände und Abteilungen denkbar. Eine Suchanfrage mit dem einzigen Suchbegriff Heinrich und den damit verbundenen über 17.000 Treffern könnte damit nicht nur in zeitlicher und räumlicher Perspektive sondern auch im Hinblick auf die den Regesta Imperii zugrunde liegende Projektstruktur visualisiert werden, indem zeitliche und räumliche Häufungen sichtbar werden.

Nutzer-beeinflusste Facettierungen: Die eben betrachteten Facettierungen beruhen auf den bereits in der Regestendatenbank der Regesta Imperii vorhandenen Datenstrukturen und könnten durch weitere, vom Nutzer selbst formulierte Facettierungskriterien ergänzt werden. Zu denken ist hier z.B. an Kriterien aus der Computerlinguistik, Begriffshäufungen oder Distanz von Suchbegriffen, ggf. auch in Verbindung mit regulären Ausdrücken und Trunkierungen.

Fazit

Zusammenfassend bleibt festzustellen, dass die Digitalisierung von mittelalterlichen Quellen für den Forscher große Vorteile mit sich bringt. So ist der Zugriff auf die Quelle sehr viel schneller als zu “analogen” Zeiten möglich. Mit Hilfe ausgereifter Expertensuchmasken bieten die hier betrachteten Portale schnellen und umfassenden Zugriff auf das Material.
Für einen sinnvollen Umfang der Treffermengen ist bei allen Portalen in der Regel die Nutzung der Expertensuche mit hinreichend einschränkenden Suchkriterien notwendig (CIN-Suche). Für explorative Suchanfragen, die von sich aus größere Treffermengen ergeben sind die Ergebnisanzeigen dagegen weniger geeignet. Auch wenn solche explorativen Suchen sich auf verschiedene der hier untersuchten Datenbanken erstrecken gibt es keine Möglichkeit, die Treffermengen als Ganzes zu untersuchen.
Festzustellen ist, dass projektübergreifende Suchanfragen unter vertretbarem Aufwand nicht über Suchinterfaces der einzelnen Projekte zu realisieren sind. Vielmehr wäre ein zweigleisiges Vorgehen sinnvoll. Zum einen arbeiten die Projekte weiter an der Bereitstellung mediävistischer Quellen im Internet und stellen interssierten Nutzern Schnittstellen für ihre Datenbanken zur Verfügung. Zum anderen arbeiten national oder EU-weit gelagerte Projekte (wie z.B. DARIAH) an Tools, mit denen umfangreiche Abfrageergebnisse sinnvoll und transparent visualisiert werden können.
Wie sehr für viele die Nutzung von Google, sei es die Suchmaschine, Google-Maps oder andere Dienste im Alltag schon unentbehrlich geworden ist, können die meisten in einer kritischen Selbstreflexion ergründen. Google liefert oft bei geringem Aufwand einen sehr guten Überblick zu den Suchergebnissen, wobei der Weg zu den Ergebnissen nicht sehr transparent ist. Meine Vorstellung von “digitalen Perspektiven” wäre daher die Formulierung neuer Fragestellungen an die digitalisierten Quellen mit Hilfe moderner, transparenter Suchtechniken, ergänzt um  leicht und intuitiv verständliche Visualisierungsmethoden.

Download PDF

Empfohlene Zitierweise:
Andreas Kuczera: Digitale Perspektiven mediävistischer Quellenrecherche, in: Mittelalter. Interdisziplinäre Forschung und Rezeptionsgeschichte, 18. April 2014, http://mittelalter.hypotheses.org/3492 (ISSN 2197-6120).

 

  1. Die CIN/POIN-Systematik wurde entwickelt von Frants, Valery I.; Shapiro, Jacob; Voiskunskii, Vladimir G.: Automated information retrieval: Theory and methods. Library and information science. San Diego: Academic Press 1997.
  2. Vgl. hierzu Wolfgang Stock, Information Retrieval: Informationen suchen und finden. München 2007, dessen Tabelle auf S. 52 als Vorlage diente.
  3. Eine intensive qualitative Analyse mit vergleichenden Suchanfragen an die verschiedenen Seiten würde den Rahmen dieser Untersuchung sprengen. Vielmehr standen beim Vergleich die dem Nutzer direkt dargeboteten Funktionen im Vordergrund.
  4. Im Einzelnen kann man nach z. B. Jaffé-Nr., Pontificia-Nr., Regesta-Imperii-Nr., Pontifiakt, Papstunterschrift, Notarsunterschriften, Zeugen, Siegel, Überlieferung, Diplomatischer Kommentar und Überlieferung filtern.
  5. Relevanz meint in diesem Fall die Relevanzkriterien der implementierten Suchmaschine SPHINX.
  6. Zu den Relevanzkriterien heißt es in der Hilfe: Die Relevanz berechnet sich durch die mathematische Ähnlichkeit von Suchanfrage und Dokument (hier Buch). Die Bedeutung einzelner Wörter hängt von ihrer Häufigkeit und der Größe des Dokumentes ab.

 

Quelle: http://mittelalter.hypotheses.org/3492

Weiterlesen

Handschriften aus dem Prämonstratenserinnenstift Pernegg in Niederösterreich

Heute steht das “Kloster Pernegg”, das sich im Eigentum des nahen Prämonstratenserstifts Geras befindet, für österreichweit geschätztes Heilfasten. Bis zum Tod der letzten Nonne 1585 war es ein im 12. Jahrhundert gegründetes Prämonstratenserinnenstift, dem Mutterkonvent Geras zugeordnet. Von 1585 bis zur Aufhebung 1783 lebten hier männliche Prämonstratenser (ab 1644 war das Stift von Geras unabhängig). Die (bedingt brauchbare) Wiener Diplomarbeit von Elke Federbar (2012) über das Stift Pernegg ist online (PDF). Bemerkenswert sind einige deutschsprachige Handschriften des 15. Jahrhunderts, die aus Pernegg stammen und […]

Quelle: http://ordensgeschichte.hypotheses.org/7025

Weiterlesen

Explore, play, analyse your corpus with TXM

A short introduction of TXM by José Calvo and Silvia Gutiérrez

 

On Feburary 6-7, 2014, the Department for Literary Computing, Würzburg University, organized a DARIAH-DE Workshop called “Introduction to the TXM Content Analysis Platform“. The workshop leader was Serge Heiden (ENS-Lyon) who is in charge of the conceptualizing and implementing TXM at the ICAR Laboratory in France.

The workshop included a brief explanation of TXM’s background, but it concentrated on a very practical approach. We learned about the “Corpora options” (that is what you can know about your corpus: POS descriptions, text navigation), but also what you can do with it: find Key Words In Context (KWIC), retrieve Parts of Speech, and moreover how you can analyse these results querying for the Most Frequent Words or the cooccurrences.

In the evening of day one, we got an overview of the state of art of the use of “Natural Language Processing for Historical Texts” in a keynote by Michael Piotrowski (IEG Mainz). First of all, he started by defining Historical Texts as all those texts that will bring major problems to NLP. In order to clarify these definitions, Dr. Piotrowski listed some of the greatest difficulties:

  • Medium and integrity: we have to remember that in order to analyse an old script that was written in clay tablets or marble, it is compulsory to first find a way to transfer this information into a digital format (not an easy task); plus: some texts are defective or unclear, and transcriptions may introduce new errors
  • Language, writing system and spelling: many of the historical texts were written in extinct languages or variants different from today’s variants; as for the writing system, the many abbreviation forms and the variety of typefaces are more or less problematic; finally, we should not forget the little problem of non-standardized spelling!
  • State of art: Historical languages are less-resourced-languages, there are few texts available, and NLP for historical languages is carried out in specific projects; that is, there are no common standards and everyone has to start from zero.

Not to discourage his public, he then offered an overview of what can be done: Part-of-speech tagging. Creating a tagger for a historical language can be done with the the following methods:

  1. From scratch: manually annotating your text
  2. Using a modern tagger and manually correcting all errors
  3. Modernizing spelling
  4. Bootstraping POS tagger (with many versions of the same text, like the Bible)

Now let’s get back to the TXM workshop. In this post, you will find a brief practical introduction to this tool. We will provide you with a rough idea of what is this software about and what you can do with it. If you would like to learn more, do check the links we have shared towards the end of this post. By the way, all words marked with a little * are explained at the end, in the “Vocabulary” section.

What is TXM?

This software is at the juncture of linguistics and scholarly editing and it’s made to help scholars analyse the content of any kind of digital text (Unicode encoded raw texts or XML/TEI tagged texts).

To get to know more about the TXM background, don’t miss Serge Heiden’s Workshop slides:

Where can I work with it?

You may work on the desktop (download page) or online version of the tool. Both platforms have advantages and disadvantages. The online version allows you to start the work without downloading or installing anything, and share your corpora with other colleagues. With the desktop version, you can easily lemmatize and analyse the Parts of Speech (POS*) of your own texts.

So that you can get a better idea of the way it works, we’ll guide you with some practical examples. Say you want to search for the lemma politics on the “Brown Corpus*. First you have to open the Index option:

2014-02-15_19h28_12

Then you use the query box to type in the query, using the following structure from the CQL* query language: [enlemma=“politics”]. In the desktop version, the results will look as follows (the web version is very similar):

2014-02-12_11h02_39

What can I do with TXM?

Explore your corpus

Corpora options

On the first column of both interfaces there’s a list of the corpora you can work with (in this case DISCOURS, GRAAL, BROWN). When you click with the right button of your mouse on one of your corpora, you will see a list of icons:

png;base6465a19490765df979These are the main tools of TXM and you will use one of these to analyse your corpus in different ways.

Corpus description (Dimensions)

Before you start with the fun, you should click the “Dimensions” option and have a look at some general information about the corpus (number of words, properties, and structural units, as well as the lexical and structural units properties). This information is richer in the desktop version:

2014-02-12_11h12_23

Text navigation

A very practical TXM feature is the text display. If you wish to open a list of the corpus’ elements, you just have to click on the book icon (called “Texts” in the online version and “Open edition” in the other). A list like the following will be shown:

2014-02-12_11h17_48

Moreover, if you click on the book icon in the “edition” column, TXM will open a readable version of our text:

2014-02-12_11h18_47

Play with your corpus

Key Words In Context (KWIC)

A very typical visualization of a corpus is the so called KWIC view, which you have already seen displayed in the politics lemma example.

With TXM you can sort the results using different criteria organizing them according to the right or left context of your word, the word form, etc; besides, you can choose which elements you want to visualize. Say you’re searching for collocations of present as an adjective and NOT the data related to the noun nor the verb form (to present). First of all you need to go to the INDEX.

Once you open this, you can set the options in the “Keyword” column and visualize the grammatical category along with the word form. Then you type “JJ_present”, where “JJ” means “adjective” and “present” is the verb form, so that only those instances of the graphical form present are selected which are adjectives. It is also possible to order this data by different criteria.

As you can see in the next screenshot, you are looking for the lemma present. Therefore, you should set the first “Sort keys” menu to “Left context”, and the second one to “Keyword”; what you’re saying to the software is that you want all the examples sorted by the Left context as a first criteria and the Keyword as a second. In the “Keyword” > “View” menu we have set “enpos, word”. With that we are ordering TXM to show us not just the word form, but also the POS. That is why we see the keywords as “VVN_present” (that means, present as a verb) or JJ_present (present as an adjective):

png;base64f22bacff5fc65745

Parts of Speech

Another way to display specific words according to their POS can be run by using the Index tool (A|Z icon), from a lexicologist point of view one the most interesting options of TXM. If you search again for the lemma present and in the properties box, you chose to see not only the word form but the POS as well, TXM will tell you the frequency, word form and POS of each different word form found in the corpus:

2014-02-12_11h53_26

If you only want the word forms of the verb to present, you can add the POS information to the query: [enlemma=“present” & enpos=“VV.*”]

These index can able to create lists of n-grams. Let’s search for the most frequent words that appear after the lemma present:

2014-02-12_11h57_37

Quantative analysis

Most Frequent Words

To query something you have to have a specific question and know some basic information, for instance: in which language is the corpus? A way to have a general idea about the texts is the Lexicon option, the icon with AZ both on white background. When you click on it, you will see a list of the most frequent word forms:

2014-02-13_11h58_08

 

You can change the settings of the query and ask to count not the word forms but the lemmas. In that case the verb to be climbs up some positions, now that is, are, were, been etc. count as one single unity:

png;base64c5510467d9a7ff1f

 

Coocurrences

Another quantitative analysis concerns the coocurrences, that is, the words (or other unities) that frequently appear close to a specific word (or to other unities). Unlike n-grams, coocurrences do not have to appear exactly after or before the unity, they just have to be somewhere close to it.

The Brown corpus was compiled in the 1960s in the United States, the main years of the Cold War. So let’s see the vocabulary related to the words United States and which one to Soviet Union:

2014-02-13_12h13_56

Progression

Another statistical option that exists on the Desktop version is the Progression (icon with an arrow). This option helps visualize how many times a unity appears in a corpus or a text. This might be interesting to see the progress of a word between two dates or see the development of a word in the different parts of a text.

For the next example, the text of Bram Stocker’s novel Dracula was imported (the version used is from the University of Adelaide). With the information of the chapters kept in XML elements, you can look for the name of the main characters and see how many times and where they appear. The next screen-shot shows the complete query:

2014-02-13_13h41_35

To understand the next graphic, you have to keep in mind that if the lines ascends, that means the name has been mentioned; if the line keeps going horizontally, it means the name didn’t appear any more.

 

2014-02-08_15h54_49

 

As you can see, the Count Dracula (yellow) is the most mentioned name in the first four chapters, but it almost disappears towards the 17th chapter. In this gap, Lucy (blue) becomes the main character and, from the 9th chapter, the Professor van Helsing (red) takes the “leading” role. It is also remarkable that this last character is not only the most frequent, but the most stable.

Sub-corpora and partitions

You can divide your corpus into two options: sub-corpora and partitions. With a sub-corpus you can choose some texts from a corpus and work with them. With the partition, you can split the corpus into more than one part and easily compare the results of the different parts. On the next screenshot, you have the menu where a Partition called “Fiction and Press partition” is being created, using the XML “text” and the property “type” to choose which kind of text is wanted. This partition will have two parts: one called “Fiction” and the other one called “Press” and each of it will contain the respective type of texts.

2014-02-13_13h26_05

Useful links

“A gentle introduction to TXM key concepts in 90 minutes” by Serge Heiden: http://sourceforge.net/projects/txm/files/documentation/IQLA-GIAT%202013%20TXM-workshop.pdf/download

Tutorial video introducing TXM 0.4.6 (WARNING: the software, specially it’s surface, is now very different): http://textometrie.ens-lyon.fr/IMG/html/intro-discours.htm

TXM background http://fr.slideshare.net/slheiden/txm-background

TXM import process http://fr.slideshare.net/slheiden/txm-import-process

Vocabulary

 

Brown Corpus

The Brown corpus consists of 500 English-language texts, with roughly one million words, compiled from works published in the United States in 1961. You can learn more about it here.

CQL

TXM uses an underlying Contextual Query Language, which is a formal system for representing queries to information retrieval systems such as web indexes, bibliographic catalogues and museum collection information. More information in the official web-page: http://www.loc.gov/standards/sru/cql/

 

POS

Here is a useful alphabetical list of part-of-speech tags used in the Penn Treebank Project (tag and description): https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html

Quelle: http://dhd-blog.org/?p=3384

Weiterlesen

Lob des Augustin / Fest der Znaimer Gurke

Der Augustin, die erste österreichische Boulevardzeitung, ist wirklich das erfreulichste Printmedium in Österreich, was durch die aktuelle Ausgabe wieder bestätigt wird. Und wie schön, es findet sich drinnen einen Beitrag über die Znojemská okurka, die Znaimer Gurke! Dies gibt mir übrigens - wohl exklusiv für den deutschen Sprachraum - die Gelegenheit, den Termin für das diesjährige Fest der Znaimer Gurke anzukündigen: Das Slavnosti okurek findet nämlich in Znjomo am 1. und 2.8.2014 statt!

Quelle: http://adresscomptoir.twoday.net/stories/752349206/

Weiterlesen

La vie dans l’homme ou l’homme dans la vie ? / Das Leben im Menschen oder der Mensch im Leben?

Généalogies franco-allemandes entre anthropologie et anti-humanisme / Deutsch-Französische Genealogien zwischen Anthropologie und Anti-Humanismus

L’école d’été organisée du lundi 21 au vendredi 25 Juillet 2014 à l’Ecole Normale Supérieure de la rue d’Ulm en coopération avec l’Université de Potsdam et l’Université franco-allemande a pour objet de comparer les « philosophies de la vie » française et allemande au XXe siècle et de les faire se confronter dans un colloque. Cette discussion autour de la dialectique entre le concept de vie et le problème de l’homme touche la tension, fondamentale pour la modernité, qui distingue la réflexion aux teintes « anthropologiques » sur la vie (en Allemagne) d’une critique « antihumaniste » (en France). L’appel s’adresse aux doctorant(e)s ou étudiant(e)s de master en philosophie. Elles/ils sont invité(e)s à présenter un abstract de 400 mots sur le thème de l’un des workshops prévus (1. Les « enjeux » : La vie dans lʼhomme ou lʼhomme dans la vie ? ; 2. Lectures croisées: chantiers des traductions et des éditions en cours ; 3. Entre langage et technique : les destins de la phénoménologie dans les philosophies françaises et allemandes au xxème siècle ; 4. La réception des discours biologiques dans les réflexions sur la vie en France et en Allemagne ; 5. Des théories de la civilisation entre l’optimisme et la décadence). Vous trouverez ci-dessous les appels à projets en français et en allemand (deadline: 9 mai).
Appel à contribution francais : Généalogies franco-allemandes entre anthropologie et anti-humanisme
Call for Papers deutsch : Deutsch-Französische Genealogien zwischen Anthropologie und Anti-Humanismus
 Candidature à envoyer à : caterina.zanfi@ens.fr ou thomas.ebke@gmx.net

La date limite de candidature est le 09 mai 2014

Lieu : École Normale Supérieure, 29, Rue d’Ulm, 75005 Paris [Salle Paul Langevin]

Transport, hébergement : Les frais de transport et d’hébergement seront pris en charge par l’organisation. Les frais de transports sont limités à un forfait de maximum 200 euros par personne. Les participants sont encouragés à indiquer dans leur candidature s’ils ont la possibilité de financer les frais de transport par d’autres institutions (par exemple leurs propres universités, le DAAD, etc.). Un logement près du lieu de la manifestation sera offert (par exemple en résidence universitaire). Publication : Une sélection d’articles sera publiée. Langues de travail : français, allemand, anglais si nécessaire (dans la discussion). Chacun pourra parler dans la langue de son choix, mais devra pouvoir comprendre la langue de l’autre. Pour plus d’informations : caterina.zanfi@ens.fr ou thomas.ebke@gmx.net

Organisation

  • Dr. Christian Sommer (Archives Husserl, UMR 8547: Pays Germaniques, CNRS/Ecole Normale Supérieure)
  • Prof. Hans-Peter Krüger (Faculté de Philosophie, Université de Potsdam)
  • Dr. Caterina Zanfi (LabEx TransferS, École Normale Supérieure Paris)
  • Dr. Thomas Ebke (Bourse Feodor-Lynen de la Fondation Alexander von Humboldt)

Quelle: http://trivium.hypotheses.org/615

Weiterlesen

Lehren und Herausforderungen für Frieden und Stabilität in Europa

Die SPD veranstaltete am vergangenen Montag im Französischen Dom in Berlin eine Diskussion darüber, welche Lehren aus den Erfahrungen des Ersten Weltkrieges für Frieden und Stabilität in Europa heute gezogen werden können. Als Ehrengast nahm auch der französische Premierminister Jean Marc Ayrault an der Veranstaltung teil. Bei der Paneldiskussion diskutierten Prof. Dr. Herfried Münkler, Prof. Dr. Anne-Marie Le Gloannec und PD Dr. Ruth Leiserowitz vom DHI Warschau über die Fragestellung. Moderiert wurde die Veranstaltung von Ute Welty.

Quelle: http://grandeguerre.hypotheses.org/1529

Weiterlesen

Die französischen Universitätsbibliotheken – Überblick über ein komplexes System

Studierende und Forschende aus Deutschland treffen in Frankreich nicht nur auf ein anders organisiertes Hochschulsystem, sondern daran angeschlossen auch auf ein breit gefächertes, aber auf den ersten Blick manchmal unübersichtlich wirkendes Bibliotheksangebot. Zur Orientierung soll hier ein knapper Überblick über … Continue reading

Quelle: http://francofil.hypotheses.org/1659

Weiterlesen

Musealisierte Zeitzeugen. Ein Dilemma

 

Einst lockte die Aura dreidimensionaler Objekte Flaneure in Museen und Ausstellungen. Doch gerade im Feld der Zeitgeschichte wandeln sich die Musentempel von Orten der ästhetischen Erfahrung zu mediatisierten Erzählräumen, in denen sich der Museumstourist durch den Dschungel aus Hörstationen und Videoprojektionen schlägt. Zeitzeugenschnipsel wecken die Illusion vielstimmiger Erinnerung(en). Nicht selten erschweren sie jedoch kritische Distanzierung und reinszenieren die “Grenzen des Sagbaren”.

 

Talking Heads – eine (un)heimliche Konjunktur

Das Bonmot vom Zeitzeugen als Feind des Historikers ist bekannt. Seine beständige Wiederholung kann man als Ritual der Abgrenzung begreifen, als wechselseitigen Ritterschlag interpretieren oder als Hiatus zwischen Erfahrungs- und Strukturgeschichte diskutieren. Zu den neueren geschichtskulturellen Praktiken gehört es jedoch, den Zeitzeugen als Leitfigur öffentlicher Erinnerung zu adeln – mit Zeitzeugenfernsehen, mit Zeitzeugenbörsen, mit Internetportalen wie dem der ZDF-Zeitgeschichtsredaktion entwachsenen “Gedächtnis der Nation” und zunehmend als talking head, der auf Monitoren in zeithistorischen Ausstellungen und Gedenkstätten per Knopfdruck Zeugnis ablegt. Die Sammlungsleiterin und Ausstellungskuratorin des Deutschen Historischen Museums, Rosmarie Beier-de Haan, spricht angesichts dieser Entwicklungen gar von einer “erdrutschartigen Verschiebung” des “Verhältnisses von Geschichtswissenschaft und Geschichtsdarstellung zum Einzelnen”, von einer “neue(n) Geschichtskultur”.1

Von individueller Erinnerung zu standardisierter Inszenierung

Fragen der Sammlung, Bewahrung und Vermittlung von Zeitzeugenerinnerungen im Spannungsfeld von individueller Erinnerung, geschichtskultureller Tradierung und geschichtswissenschaftlicher Analyse wurden bereits vielfach im Kontext der Erinnerung an den Holocaust diskutiert. Doch auch in jüngeren Feldern der Zeitgeschichte hat die museale Inszenierung von talking heads Konjunktur. Ein Blick in die Berliner Ausstellungs- und Gedenkstättenlandschaft zur DDR-Geschichte und deutschen Teilung lässt dies bereits erahnen. Die “Erinnerungsstätte Notaufnahmelager Marienfelde” nahm hier eine Vorreiterrolle ein, indem sie Audio- und Videomaterial biografischer Interviews frühzeitig in die ständige Ausstellung integrierte. Jüngere Ausstellungen folgen diesem Trend: 2011 die im “Tränenpalast” eröffnete Ausstellung “GrenzErfahrungen. Alltag der deutschen Teilung” und im Oktober 2013 die multimediale Dauerausstellung “Gefangen in Hohenschönhausen. Zeugnisse politischer Verfolgung 1945-1989″. In Hohenschönhausen erinnern Ein- und Ausgangsszenario der Ausstellung an das Washingtoner Holocaust-Museum und seinen “Tower of faces”. Auf dieses bereits kulturübergreifend vertraute ästhetisch-inszenatorische Muster der Opfererinnerung stößt man auch andernorts – in der Gedenkstätte Berliner Mauer oder im “Ort der Informationen” am Holocaust-Denkmal.

Vielstimmiges Gedächtnis – eine museale Chimäre

Die Musealisierung von Zeitzeugenerinnerungen kann ganz postmodern als Abschied von der Meistererzählung gefeiert werden. Talking heads repräsentieren die Subjektivität historischer Erfahrungen und die Pluralität der Erinnerungen. Erinnerungsschnipsel versprechen Multiperspektivität und öffnen Raum für kontroverse Deutungen und Orientierungen.2 Unübersehbar sind jedoch Dilemmata dieses Musealisierungsprozesses.
Erstens scheinen vermeintlich authentische und erfahrungsgesättigte Erinnerungen in der Geschichtskultur der Gegenwart mehr Anerkennung zu erfahren als historisierende oder abstrakte strukturgeschichtliche Zugriffe. Letztlich braucht es aber diese zwei Seiten der Medaille, um biografische Erzählungen historisch zu rekontextualisieren und Handlungsspielräume zu diskutieren, und damit die Ebene emotionaler Betroffenheit zu verlassen und kritische Identitätsreflexion zu ermöglichen.
Zweitens profilierten sich Zeitzeugenerinnerungen zunächst als Gegenerzählungen gegen kollektives Verdrängen und Vergessen. In unserer opferzentrierten Erinnerungskultur erleben wir jedoch gegenwärtig die Transformation vielschichtiger Gegenerzählungen zu einer Meistererzählung, die im musealen Kontext vom Schweigen der Täter, Zuschauer oder der “Anderen” profitiert. Was bleibt sind kritische Distanz zur Vergangenheit und moralische Selbstvergewisserung, weniger historisches Verstehen und die Auseinandersetzung mit widersprüchlichen Biographien und ihren Brüchen.
Drittens sind Medialisierung und Musealisierung als aufeinander bezogene Prozesse der kulturellen Kodierung und Sinnstiftung zu begreifen – von der Auswahl der Zeitzeugen, über den auf typologisierende Zugriffe und exemplarische Einsichten zielenden Schnitt der Interviews bis hin zur musealen Präsentation. Musealisierte Zeitzeugenerzählungen entkontextualisieren so biografische Erinnerungen, werten Erinnerungsschnipsel symbolisch auf, bewerben sie als authentische Geschicht(en) und inszenieren talking heads als zeitlose moralische Instanzen – nicht immer, aber immer öfter.

Selbstvergewisserung  oder destruktive Erinnerungen

Nichts Neues?! Mit den skizzierten Dilemmata der Musealisierung von Zeitzeugenerinnerungen kehrt ein vielfach diskutiertes Problem historischer Orientierung wieder, das nicht nur Volkhard Knigge3 oder Harald Welzer4 für den Bereich der Gedenkstätten als Diskrepanz zwischen historischem Lernen und ritualisiertem Gedenken kritisieren. Somit bleibt die Sammlung, Archivierung und Repräsentation von widersprüchlichen und destruktiven Erinnerungen eine museale und auch museums- und gedenkstättenpädagogische Herausforderung – gerade wenn man zeithistorische Ausstellungen und Museen als diskursive Orte, als Orte der Verunsicherung begreift und nicht als Tempel der Selbstvergewisserung nutzt, in denen talking heads unsere Wahrnehmungen und Deutungen musealer Objekte lenken und durch ihre “Ordnung der Dinge” die “Grenzen des Sagbaren” präformieren.

 

 

Literatur

  • Sabrow, Martin / Frei, Norbert (Hrsg.): Die Geburt des Zeitzeugen nach 1945, Göttingen 2012.
  • Fritz-Bauer-Institut u.a. (Hrsg.): Zeugenschaft des Holocaust. Zwischen Trauma, Tradierung und Ermittlung, Frankfurt/M. / New York 2007.
  • Beier-de Haan, Rosmarie: Erinnerte Geschichte – Inszenierte Geschichte. Ausstellungen und Museen in der Zweiten Moderne, Frankfurt/M. 2005.
Externe Links

 


Abbildungsnachweis
Objektensemble der Ausstellung “GrenzErfahrungen. Alltag der deutschen Teilung” im Tränenpalast Berlin-Friedrichstraße. © Saskia Handro 2014.

Empfohlene Zitierweise
Handro, Saskia: Musealisierte Zeitzeugen. Ein Dilemma. In: Public History Weekly 2 (2014) 14, DOI: dx.doi.org/10.1515/phw-2014-1817.

Copyright (c) 2014 by De Gruyter Oldenbourg and the author, all rights reserved. This work may be copied and redistributed for non-commercial, educational purposes, if permission is granted by the author and usage right holders. For permission please contact: julia.schreiner (at) degruyter.com.

The post Musealisierte Zeitzeugen. Ein Dilemma appeared first on Public History Weekly.

Quelle: http://public-history-weekly.oldenbourg-verlag.de/2-2014-14/musealisierte-zeitzeugen-ein-dilemma/

Weiterlesen

Twitternde Nachtspatzen bei der #LNDM14 – Eine Hashtag-Analyse zur Langen Nacht der Museen in Hamburg

Als „Nachtspatz“ erfuhr ich im Internationalen Maritimen Museum, warum die ersten Rettungsboote auf der Titanic fast leer waren; im Finnischen Salon lernte ich im Museum für Völkerkunde Hamburg fast alles über die Kahvipaussi; in der Hamburger Kunsthalle erklärte mir Filmemacher Peter Sempel, dass es in seinem Film „Die Ameise der Kunst“ nicht nur um Jonathan Meese ginge und im Medizinhistorischen Museum Hamburg ließ ich schließlich die Atmosphäre des Sektionssaals auf mich wirken. Die Lange Nacht der Museen in Hamburg ist eine Veranstaltung der Hamburger […]

Quelle: http://musermeku.hypotheses.org/1115

Weiterlesen

Drei Gehorsamspflichten, vier Tugenden und sieben Scheidungsgründe

Im konfuzianisch geprägten China nahmen Frauen – nicht zuletzt durch die “drei Gehorsamspflichen und die vier Tugenden” (sancong side 三從四德) – im gesellschaftlichen Leben eine sehr untergeordnete Rolle ein. Die “drei Gehorsamspflichten” bestanden gegenüber dem Vater vor der Ehe, gegenüber dem Mann in der Ehe und gegenüber dem Sohn nach dem Tode des Mannes. Unter den “vier Tugenden” verstand man Sittsamkeit, geziemende Sprache und Fleiß.

Im allgemeinen gab es sieben Gründe (qichu 七出), die eine Scheidung rechtfertigten – diese waren seit der Tang-Zeit (618-906) gesetzlich festgelegt[1]:

  • kein männlicher Nachkomme (wu zi 無子)
  • Ehebruch (yinyi 淫佚)
  • Ungehorsam gegenüber den Schwiegereltern (bu shi jiu gu 不事舅姑)
  • Zank, Zwietracht (koushe 口舌) beziehungsweise Geschwätzigkeit (duoyan 多言)
  • Diebstahl (daoqie 盜竊)
  • Neid (duji 妒忌)
  • ansteckende Krankheit (eji 惡疾)

Im Herbst 1900, als die Welt noch ganz im Banne des Entsatzes der während des “Boxeraufstands” belagerten Gesandtschaften in Peking stand, hieß es in der im australischen Perth erscheinenden Zeitung The Inquirer and Commercial News zum ersten dieser sieben Gründe:

In a country where the avowed end of marriage is to raise up a posterity to burn incense at the ancestral graves, it is not strange that ‘childlessness’ should rank first among the grounds for divorce.[2]

Lag keiner dieser sieben Gründe vor, war dem Mann die Scheidung nicht erlaubt. Frauen konnten sich dann scheiden lassen, “wenn ihr Mann ihre Ahnen beschimpft oder ein Mitglied ihrer Sippe ermordet hatte.”[3]

  1. Die “westliche” Sinologie hat sich dieser sieben Gründe früh angenommen; vgl. etwa: William Frederick Mayers: The Chinese Reader’s Manual. A handbook of biographical, historical, mythological, and general literary reference. Reprinted from the Edition of 1874 (London: Probsthain | Shanghai: American Presbyterian Mission Press, 1910) 350 (Nr. 220).
  2. “Seven Grounds for Divorce.” The Inquirer and Commercial News (Perth), Vol. LVIII. No. 3.353, 19 October 1900, S. 1.
  3. Wolfram Eberhard: Lexikon chinesischer Symbole. Die Bildsprache der Chinesen (München, 5. Aufl., 1996) 251 (“Scheidung”).

Quelle: http://wenhua.hypotheses.org/1095

Weiterlesen