Leitfragen der Session: Was sind DH-FDM-Skills? Welche Kompetenzen werden benötigt? Gibt es Best Practices? Was gehört in ein Data Literacy Curriculum? Was muss ein/e traditionelle/r Geisteswissenschaftler/in wissen, um mit einem Digital Humanist zusammenzuarbeiten?
Vom 03. bis 06. März 2020 habe ich an der DHd 2020 in Paderborn teilgenommen. Im Folgenden möchte ich einen thematischen Schwerpunkt näher beleuchten, der mich als Teilnehmer besonders interessiert hat.
Das Thema, an dem ich auch persönlich forsche und das ich daher auf der diesjährigen DHd besonders gesucht und verfolgt habe, ist die Frage, wie und inwieweit Maschinelles Lernen (ML) genutzt werden kann, um geisteswissenschaftliche (und insbesondere literaturwissenschaftliche) Fragestellungen zu beantworten (oder zumindest neue Einsichten zu erzeugen).
Maschinelles Lernen bezeichnet eine Methode, bei der mittels statistischer Algorithmen und Daten Modelle erzeugt werden, die aus den gesehenen Daten (statistische) Verallgemeinerungen ziehen und somit auf neue und vorher ungesehene Daten angewendet werden können. Die Fülle an vorhandenen Algorithmen und Verfahren ist groß; eine ML-Familie ist unter dem Namen “Deep Learning” bekannt geworden und bedient sich vor allem Künstlicher Neuronaler Netze. Diese Netze waren, auch unter Verwendung von immer stärker werdenden Rechnerresourcen, in bestimmten Gebieten wie Automatische Bilderkennung oder Automatische Spracherkennung, so erfolgreich, dass sie bald zugleich für andere Gebiete im großen Stil eingesetzt wurden; darunter für Textverarbeitung.
Autor*innen: Jonathan Geiger, Digitale Akademie, Akademie der Wissenschaften und der Literatur | Mainz Thomas Skowronek, Leibniz-Institut für Geschichte und Kultur des östlichen Europa (GWZO), Leipzig Aline Deicke, Digitale Akademie, Akademie der Wissenschaften und der Literatur | Mainz
In der Session “Datenqualität und LOD in den Geisteswissenschaften” des Barcamps “Data Literacy”, organisiert von der DHd-AG Datenzentren auf der DHd-Konferenz 2020 in Paderborn, wurden die beiden Ausgangsfragen nach der Datenqualität in den Geisteswissenschaften und Linked Open Data in einer Trias „Datenqualität“, „Data Literacy“ und „LOD in den Geisteswissenschaften“ aufgespannt. Wie sich in der Diskussion der drei Themenfelder und ihrer Beziehung gezeigt hat, drehen sich Fragen der Qualität, Kompetenz und Standardisierung in den Geisteswissenschaften (und vermutlich nicht nur dort) einerseits um technische Entwicklungen, andererseits – und zu einem großen Teil – um Personen, Prozesse und Ressourcen.
Datenqualität und -standards
Besonders im Fokus stand dabei die Datenqualität. Es gibt einen breiten Konsens darüber, dass in der (geisteswissenschaftlichen) Forschung ein hohes Maß an Datenqualität herrschen und hergestellt werden muss. Datenqualität ist dabei ein komplexes, multidimensionales Gebilde – beispielsweise können eine technische, eine informationelle und eine didaktische Dimension unterschieden werden, die sich aber stets wechselseitig bedingen.
Die Mediävistik und ihre digitalen Spielräume auf der #DHd2020
Der Mittelalterforschung wird auch heute noch nachgesagt, sie sei eher traditionell orientiert und zeige nur eine langsame Offenheit gegenüber der Anwendung neuer digitaler Methoden. Auf der diesjährigen Tagung des DHd (Paderborn 2.–6. März) zeigte die Mediävistik in der digitalen Geisteswissenschaft jedoch nicht nur eine breite wissenschaftliche Präsenz, sondern wusste auch beim Posterlam zu überzeugen. Als Stipendiatin des DHd und CLARIAH-DE,* war ich während der Tagung der digitalen Mediävistik auf der Spur, es folgt ein Überblick über die mediävistischen Beiträge auf der #DHd2020:[1]
*An dieser Stelle noch einmal herzlichen Dank für die Unterstützung!
Clemens Liedtke (Heidelberg) präsentierte im Beitrag DH’s Next Topmodel? Digitale Editionsentwicklung zwischen Best Practice und Innovation am Beispiel des „Corpus Masoreticum“ ein Beispiel aus den jüdischen Studien zur digitalen Transformation der Handschriftenforschung einer hebräischen Bibeledition. Er erläuterte, welchen Einfluss die Digitalisierung auf die Verfügbarkeit edierbarer Materialien hat und damit auf die Grundlagen textkritischer Editionen.
Drei Dinge, die ich durch die DHd2020 gelernt habe:
– Workshops sind schnell voll – man sollte sich also früh genug anmelden.
– Digital Humanities sind ein breiteres Feld, als ich vorher gedacht habe.
– Postersessions sind anstrengend, aber auch bereichernd. Die meisten Besucher*innen sind ehrlich interessiert und es macht mehr Spaß, als gedacht, die eigene Arbeit auf diese Weise vorzustellen.
Autor*innen: Ulrike Wuttke, Fachhochschule Potsdam/RDMO, stv. Convenor DHd AG Datenzentren Patrick Helling, Data Center for the Humanities (DCH), Universität zu Köln
Für diese Session des von der DHd-AG Datenzentren initiierten Barcamps „Data Literacy“ auf der DHd-Konferenz 2020 an der Universität Paderborn wurden zwei Themenbereiche zusammengelegt, deren jeweiliger Fokus sogenannte Incentives für das Forschungsdatenmanagement, einerseits für Studierende und andererseits für Wissenschaftler*innen, waren. Schnell merkten wir bei der Diskussion, dass es dabei schwierig ist, die beiden Zielgruppen der Studierenden und der Wissenschaftler*innen scharf voneinander abzugrenzen, vor allem wenn wir Studierende als zukünftige Wissenschaftler*innen betrachten. Dennoch haben wir versucht für beide Gruppen spezifische Aspekte herauszuarbeiten, wenn auch letztendlich aufgrund des Hintergrunds der Teilgebenden dieser Session Wissenschaftler*innen etwas stärker im Vordergrund standen.
Als erstes diskutierten wir den Unterschied zwischen extrinsischen und intrinsischen Gründen, sich für Forschungsdatenmanagement (FDM) zu interessieren. Es ist hierbei davon auszugehen, dass intrinsische Motivation für FDM zu nachhaltigerem Handeln und nachhaltigeren Ergebnissen führt.
Autor*innen: Patrick Helling, Data Center for the Humanities (DCH), Universität zu Köln Jacqueline Klusik-Eckert, IZdigital, Friedrich-Alexander-Universität Erlangen-Nürnberg Julian Schulz, IT-Gruppe Geisteswissenschaften, LMU München
Im Fokus der Session stand die Auseinandersetzung mit der Rollen- und Kompetenzverteilung unterschiedlicher Akteure und Infrastrukturen, die im Kontext von Data Literacy innerhalb der Geisteswissenschaften aktiv sind. Im Rahmen der Diskussion wurden folgende Fragen behandelt: Welche (universitären) Institutionen spielen eine tragende Rolle bei der Vermittlung von Data Literacy? Wie ist das Verhältnis zwischen fachspezifischen Kompetenzzentren und generischen Serviceeinrichtungen? Welche Strukturen sind nötig, um (geisteswissenschaftliche) Data Literacy in einem so heterogenen Ökosystem wie der Universität koordiniert und zielorientiert zu vermitteln?
Ansätze aus der Praxis: Unterschiedliche Organisationsformen für die Vermittlung von Data Literacy
Ausgangspunkt der Diskussion waren die Angebote des Digital Humanities Virtual Laboratory (DHVLab), das an der Ludwig-Maximilians-Universität (LMU) München entwickelt wurde und mittlerweile an verschiedenen Standorten zum Einsatz kommt sowie des Digital Humanities Lab (DHLab) der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU). Trotz der sehr ähnlich klingenden Akronyme handelt es sich hierbei um zwei unterschiedliche Strategien hinsichtlich der Vermittlung von Data Literacy:
Mein Programm auf der DHd – eine sehr nüchterne Betrachtung:
Montag
Workshop zu CATMA 6: Webbasiertes Analyse- und Annotationssystem für literarische Texte. Bearbeitet wurde von allen TeilnehmerInnen beispielhaft „Erstes Leid“ von Franz Kafka.
Dienstag
Barcamp Data Literacy: Anstoß grundlegender Diskurse; Was bedeutet Data Literacy für die DH? Wie und welche Datenkompetenzen müssen erworben werden? Wie kann der Kompetenzerwerb im Curriculum abgebildet werden? Plädoyer für eine neue Datenhermeneutik in den digitalen Geisteswissenschaften.
Workshop zu KOMPAKKT: Ein aus den Theaterwissenschaften entwickeltes multimediales Annotationssystem für kollaboratives und interdisziplinäres Arbeiten.
Mittwoch
Kurzer Einblick in das Panel Altbausanierung mit Niveau – die Digitalisierung gedruckter Editionen: Best Practices zu digitalisierten Editionen.
Digital Humanities Community: Beispielhafte Vorstellung verschiedener Projekte. Denkanstöße durch Vorträge zu „Digital Humanities als community-induziertes Phänomen“, „Partizipatives Design in Digital Humanities Projekten“ und niederschwelligen „Public Humanities Tools“.