Interoperationalität und semantisches Web für Mediävisten. Bericht zur Training School “Transmission of texts. New tools, new approaches” am IRHT Paris (31. März – 4. April 2014)

Training School am IRHT (Foto: Hanno Wijsman)

Training School am IRHT (Foto: Hanno Wijsman)

Anfang April konnte ich an einem gemeinsam von der COST Action „Medioevo Europeo“, dem Institut de Recherche d’Histoire de Textes (IRHT) und dem Projekt Biblissima organisierten Digital Humanities-Seminar teilnehmen. Unter dem Titel “Transmission of texts. New tools, new approaches”(mehr Infos: hier) standen dabei vor allem Fragen der Interoperationalität und das semantische Web im Vordergrund. Anhand konkreter Praxisbeispiele wurden hier neue Ansätze und Tools vorgestellt, die sich teilweise noch in der Entwicklung befinden, die aber zugleich auf sehr viel hoffen lassen. Damit verbunden war eine ebenfalls sehr praxisorientierte Einführung in TEI-XML und RDF.

Die Training School bot eine ganze Woche lang jeden Tag von 9 bis 19 Uhr ein intensives Programm. Von daher kann ich leider nicht alles wiedergeben, was ich hier gesehen und gelernt habe. Ich versuche aber mal, zumindest die Highlights zusammenzufassen, die ich mir notiert habe. Wer weitere Fragen hat, kann sich gerne an mich wenden.

Wichtiger Bestandteil des Programms war natürlich die Vorstellung der Beteiligten und deren Projekte. Nicht zuletzt, weil hier auch genau mit jenen Hilfsmitteln und Methoden gearbeitet wird, die im Rahmen der Training School vorgestellt wurden. Die Bedeutung der Interoperationalität und die Funktionsweise des semantischen Webs ließen sich so direkt am konkreten Beispiel nachvollziehen.

Sismel / Trame

Da ist einerseits das italienische Projekt TRAME, das am SISMEL in Florenz beheimatet ist, einer der Stützen der COST Action. Ziel von TRAME ist es, eine Metasuchmaschine für alle Datenbanken und -repositorien zu konstruieren, die Informationen zu mittelalterlichen Handschriften enthalten (Digitalisate, Kodikologie, Textgeschichte).

IRHT

Hauptveranstalter der Training School jedoch war das IRHT, in dessen Räumen auf der Avenue de Iéna auch die meisten Veranstaltungen stattfanden. Leider ist das IRHT in Deutschland kaum bekannt, was wirklich schade ist. Denn das auf die Erforschung alter Handschriften und Texte und deren (Überlieferungs-)Geschichte spezialisierte IRHT ist eine geradezu unglaubliche Einrichtung. Seit seiner Gründung in den 1930er wird hier alles gesammelt, was sich in Frankreich und weltweit zu Handschriften und alte Texten finden lässt. Organisiert ist das IRHT in 13 Sektionen, die gemeinsam alle hierzu notwendige Expertise unter einem Dach zusammenfassen. Die Bandbreite reicht von der Latinistik, Romanistik, Arabistik, Graezistik und Hebraistik, über Kodikologie, Bibliotheksgeschichte und Heraldik, Lateinische Paläographie und Diplomatik bis hin zu Handschriftenilluminationen. Dabei verfügt jede Sektion über eine herausragende Bibliothek, die jedes Forscherherz höher schlagen lässt. Wo sonst findet man z.B. sämtliche Handschriftenkataloge sowie Ausstellungs- und Auktionskataloge an einem Ort versammelt? Schließlich bietet das IRHT auch immer wieder Schulungen an, um Doktoranden und andere Interessierte im Umgang mit Handschriften auszubilden. Vielleicht wird ja die Direktorin des IRHT ihr Haus alsbald einmal auf dem DFMFA-Blog vorstellen.

Auf alle Fälle lohnt es sich, diese Institution einmal näher anzusehen. Nicht zuletzt, weil die über Jahrzehnte gesammelten Informationen zu Texten, Handschriften, Buchbesitzern etc., die bis vor kurzem noch allein in den vielen Zettelkästen des IRHT einsehbar waren, nun sukzessive online gehen. Dazu gehören auch die 76.000 Mikrofilme und digitale Reproduktionen von Miniaturen und Handschriften, die in Bibliotheken jenseits der Pariser Nationalbibliothek lagern. Interoperationalität spielt dabei eine große Rolle, denn all die verschiedenen Datensammlungen des IRHT sind miteinander verlinkt.

Rückgrat der Architektur ist die Datenbank MEDIUM, in der man früher noch die am IRHT vorhandenen Mikrofilme gesucht hat. Heute findet man hier alle Handschriftensignaturen verzeichnet, zu denen am IRHT Informationen zu finden sind. Die Handschriftensignaturen bilden sozusagen den Primärschlüssel zu dem ganzen System. Entsprechend kann man auch nach den Signaturen suchen. Oder aber, unter Verwendung der recherche avancée, den Bestand auch nach Eigenschaften wie Sprache, Dekoration usw. filtern. Die einzelnen Handschriften in MEDIUM sind dann wiederum mit den entsprechenden Angaben in den weiteren Datenbanken verlinkt, die da sind (in Auswahl):

  • Jonas: Katalog mittelalterlicher französischsprachiger Texte und Handschriften weltweit, durchsuchbar nach Autor, Titel und Signatur, einschließlich Texttradition und Bibliographie. Die Datenbank ist natürlich nicht komplett (zumindest was mein Thema angeht), aber man kann hier schon eine Menge finden und sie wird ständig erweitert. U.a. im Rahmen eines laufenden Katalogisierungsprojektes zu den bisher weitgehend noch unbekannten französischen Beständen der Bibiliotheca Vaticana (ca. 400 Handschriften!).
  • Bibale: Informationen zur Provenienz der Handschriften vom Mittelalter bis heute. Hier ist es möglich, anhand der Besitzvermerke, alter Signaturen, ex libris, Besitzerwappen, Inventare, Einbände usw. die Provenienz einer einzelnen Handschrift zu ermitteln oder auch ganze historische Bibliotheksbestände zu rekonstruieren.
  • Initiale: kunsthistorische Analyse dekorierter und illuminierter Handschriften und Inkunabeln.
  • Pinakes: Griechische Texte und Handschriften.

Die einzelnen Angaben wiederum sind mit der BVMM verbunden, der virtuellen Bibliothek mittelalterlicher Handschriften in französischen Bibliotheken (außer BnF) mit Bildern aus über 10.000 Handschriften, von denen hier über 3000 als vollständiges Digitalisat zu finden sind. Der Viewer erlaubt es dabei, auch mehrere Bilder gleichzeitig anzuzeigen und miteinander zu vergleichen.

Biblissima – das Megaprojekt

Biblissima, der dritte Partner der Training school, ist in der Tat ein wahres Megaprojekt. Wenn man sieht, was die BnF (einer der Partner) mit ihrer Digitalisierungsinitiative und Gallica bereits auf die Beine gestellt hat, kann man sicherlich davon ausgehen, dass auch dieses Projekt wie geplant auch umgesetzt wird. Biblissima soll nämlich nichts anderes als die „Bibliothek der Bibliotheken“ des 21. Jahrhunderts werden. So etwas wie eine, oder besser, die Metabibliothek, in der alle handschriftenrelevanten Daten der beteiligten Institutionen zugleich und miteinander kombiniert anzeigbar und durchsuchbar sein werden. Und das meint:

  • Digitialisate,
  • digitale Editionen
  • und Metadaten aus Forschungsdatenbanken (Handschriftenbeschreibungen, Ikonographie, Einband, Inkunabeln, etc.).

Während heutzutage jede Handschriftenbibliothek für ihre Bild- und Metadaten ein eigenes Format verwendet und die Bilder und Informationen der einzelnen Einrichtungen somit – um auf das in den Präsentationen immer wieder gebrauchte Bild zurückzugreifen – wie in einzelnen Silos lagern, die nicht mit einander kommunizieren können, soll Biblissima es ermöglichen, all diese Bilder und Daten miteinander in Kontakt zu bringen. Dafür wird auf ein gemeinsam mit Stanford entwickeltes Format (IIIF) und auf eine gemeinsame Technologie für die Viewer (Shared Canvas) zurückgegriffen. Letztere besteht darin, die einzelnen Handschriftenseiten als Grundlage zu nehmen. Diese werden dabei a priori als freie Fläche definiert, auf der man dann alle möglichen Informationen als einzelne Datenschichten ablegen kann: Digitalisate, digitale Editionen, Informationen zu Text und Handschrift, zu den Miniaturen, Schwarzlichtfotos, was auch immer. Wer schon einmal einen ersten Blick darauf werden möchte, findet hier ein Demo: http://demos.biblissima-condorcet.fr/mirador/ (nähere Infos dazu: hier).

Mit Biblissima soll es dann möglich sein, zu einer Handschriftenseite oder zu einer ganzen Handschrift (selbst wenn deren Teile getrennt über mehrere Bibliotheken verteilt sind) alle erreichbaren Informationen in ein und demselben Viewer gemeinsam anzeigen zu lassen. Dies kann auch mit mehreren Handschriften gleichzeitig geschehen, wenn man diese z.B. miteinander vergleichen möchte.

Für den Anfang sollen hier die virtuellen Bibliotheken der BnF (Gallica), die oben erwähnte BVMM des IRHT sowie die BVH (Les bibliothèques virtuelles humanistes der Universität Tours) miteinander verbunden werden. Aber auch die British Library und mehrere amerikanische Bibliotheken sind mit dabei. Die Datenpools speisen sich aus den genannten Datenbanken des IRHT, den Metadaten der BnF und weiteren Quellen – die aktuelle Liste umfasst ca. 50 Einzeldatenbanken.

Begleitet werden soll das Ganze durch eine Auswahl frei zur Verfügung stehender Arbeitsinstrumente für die Erstellung digitaler Editionen und deren Analyse. Zudem gibt es auf der Seite von Biblissima bald ein Toolkit, das die verschiedenen im Netz vorhandenen Datenbanken und Tools zusammenfasst und nach verschiedenen Kriterien filtern lässt.

Das Ganze ist natürlich ein Musterbeispiel für die Möglichkeiten des semantischen Webs. Aktuell wird hierfür der Thesaurus und eine Ontology speziell zur Beschreibung von Handschriften und deren Überlieferung erstellt, wobei das RDF-Framework auf CIDOC-CRM und FRBRoo basiert. Wie genau so etwas passiert, das wurde in einem der Praxisteile des Seminars gezeigt … und geübt.

Der Praxisteil: Interoperationalität und semantisches Web mit TEI-XML und RDF

Die 20 Teilnehmer aus insgesamt 14 Ländern haben also nicht nur die schöne neue Welt von morgen präsentiert bekommen, sondern auch ganz konkret erfahren und üben können, wie das alles funktioniert. Und zwar immer anhand der laufenden Arbeiten in den verschiedenen Projekten der beteiligten Institutionen. So wurde für die Markierung von Texten nach TEI- Richtlinien an alten Bibliotheksinventaren gearbeitet, auf deren Grundlage man am IRHT den Bestand der historischen Bibliotheken von Chartres rekonstruiert und mit den Resten abgleicht, die nach dem Bombardierung der Bibliotheque municipale von Chartres während des Zweiten Weltkriegs übrig geblieben sind. Verwendet wurde dabei der XMLmind_XML_Editor, der entsprechend angepasst wurde und der wohl auch dem XML-Editor im Toolkit von Biblissima zugrundeliegen wird.

Methoden und Tools zur Arbeit mit RDF im semantischen Web (Thesaurus erstellen, RDF-Triples formulieren und auf URI‘s verweisen, SPARQL-Abfragen erstellen) wurde uns wiederum am konkreten Beispiel des Biblissima-Projektes vorgeführt, bevor wir es dann auch selbst für unsere eigenen Projekte ausprobieren konnten.

Die Erstellung digitaler Editionen, insbesondere des kritischen Apparats (Varianten und Kommentare), wurden am letzten Tag schließlich anhand des nicht minder beeindruckenden Projektes SourcEncyMe geübt, einer kollaborativen Onlineplattform zu mittellateinischen Enzyklopädien und der Identifikation ihrer Quellen, die bisher noch unveröffentlicht ist. Dominique Poirel hat darüber hinaus in die verschiedenen Möglichkeiten zur Erstellung von Stemmata eingeführt. Wie sich das Ganze dann anhand TEI-encodierter Texte zumindest semi-automatisch umsetzen und graphisch aufbereiten lässt, hat anschließend Dominique Stutzmann gezeigt. Er selbst leitet die Lateinische Paläographie am IRHT und hatte am Tag zuvor sein eigenes digitales Projekt Oriflamms vorgestellt, das ebenfalls nicht unerwähnt bleiben soll. Hier geht es um die Möglichkeiten der automatischen Texterkennung für mittelalterliche Handschriften, wobei das Projekt schon beachtliche Resultate erzielt. Eine genauere Projektvorstellung gibt es voraussichtlich im nächsten Semester im Münsteraner „Forschungskolloquium Mittelalter (400-1500)“.

Fazit

Alles in allem war das, was während der 5 Tage am IRHT und bei Biblissima gezeigt und vorgeführt wurde, eine beeindruckende Demonstration des State of the art. Gerade der Umstand, dass die beiden Leitmotive Interoperationalität und semantisches Web hier immer wieder am praktischen Beispiel in ihrer ganzen Bedeutung fassbar wurden, war für mich eine der wichtigsten Erfahrungen dieser Training School. Das einzige, wovon ich mir noch mehr gewünscht hätte, waren die praktischen Übungen. Denn gerade durch die Arbeit mit Material aus den laufenden Projekten wurden Funktion und Sinn der einzelnen Methoden und Tools erst richtig erfahrbar. Die im Titel angekündigten new tools und new approaches haben sich im Programm der Training School damit aufs Beste miteinander verbunden.

Was mich letztlich zu der Frage bringt, wie es eigentlich mit ähnlich gelagerten Projekten in Deutschland aussieht. Vielleicht könnte man einmal eine Übersicht auch zu aktuellen mediävistischen DH-Projekten und Planungen in Deutschland hier auf dem DigiGW-Blog zusammenzustellen. Sehr gute Initiativen zur digitalen Rekonstruktion historischer Bibliotheken wie das Virtuelle Skriptorium St. Matthias in Trier, weitreichende Digitalisierungsinitiativen wie die der BSB und Metakataloge wie die Manuscripta medievalia gibt es ja auch hier. Und ich habe den Eindruck, dass sich da auch gerade einiges tut. Diese alle einmal in einem Überblick zusammenzufassen und vorzustellen wäre sicherlich sehr spannend und könnte gleichzeitig dazu beitragen, die Digitalen Geschichtswissenschaften bzw. die digitale Mediävistik und all das, was damit in Zukunft möglich wird, auch hier noch sichtbarer und bekannter zu machen.

 

Quelle: http://digigw.hypotheses.org/723

Weiterlesen