Bericht zum Workshop „(Generative) KI für Kultur- und Textdaten“, 4. und 5. November 2024, Goethe- und Schiller-Archiv, Weimar

Autor: Gerrit Brüning

Der Einsatz Künstlicher Intelligenz in den digitalen Geisteswissenschaften hat durch die Fortschritte im Bereich großer Sprachmodelle (LLMs) und insbesondere die Veröffentlichung von GPT-3.5 im November 2022 eine neue Stufe erreicht. Seither hat sich das methodische Feld durch multimodale Modelle, Retrieval Augmented Generation (RAG) und Integration graphbasierter Ansätze nochmals weiterentwickelt und ausdifferenziert. Die perspektivischen Einsatzszenarien reichen damit weit über Sprachverarbeitung und Textgenerierung hinaus. Die damit verbundenen innovativen und experimentellen Ansätze sind Teil eines größeren Spektrums etablierterer Formen maschinellen Lernens zur Lösung spezifischer Aufgaben (z.B. Bildanalyse, Handschriftenerkennung, Topic Modeling, Named Entity Recognition und andere NLP-Tasks). Sie regen aber auch zu ethischen Diskussionen, zur erneuten Betrachtung von hergebrachten Problemen der Philosophie des Geistes an und halten in Lehr-Lern-Situationen Einzug.



[...]

Quelle: https://dhd-blog.org/?p=21880

Weiterlesen

Text+ IO-Lecture: OAPEN & Directory Access Book (10.02.2025, virtuell, 11:00-12:30 MEZ)

OAPEN (Open Access Publishing in European Networks) bietet ein breites Spektrum an Fachwissen, Dienstleistungen und gut kuratierten wissenschaftlichen Inhalten für Bibliothekare, Verleger, Forscher und Geldgeber. OAPEN fördert und unterstützt den Übergang zu Open Access für akademische Bücher durch die Bereitstellung offener Infrastrukturdienste für die Akteure der wissenschaftlichen Kommunikation. Wir arbeiten mit Verlagen zusammen, um eine qualitätsgeprüfte Sammlung von Open-Access-Büchern aufzubauen, und bieten Dienstleistungen für Verlage, Bibliotheken und  Forschungsförderer in den Bereichen Hosting, Hinterlegung, Qualitätssicherung, Verbreitung und digitale Bewahrung.

 

 

 

 

Das DOAB (Directory of Open Access Books) ist ein von der Community betriebener Suchdienst, der wissenschaftliche, von Experten begutachtete Open-Access-Bücher indexiert und zugänglich macht und Nutzern hilft, vertrauenswürdige Open-Access-Buchverlage zu finden. Alle DOAB-Dienste sind kostenlos und alle Daten sind frei verfügbar.

[...]

Quelle: https://dhd-blog.org/?p=21873

Weiterlesen

Lecture: Wikidata for (Legal) Historians, 10.12.24, mpilhlt (Frankfurt) and online

We invite you to the lecture, organised as part of the seminar series ‘Legal History Meets Digital Humanities’ at the Max Planck Institute for Legal History and Legal Theory and held in a hybrid format on 10 December 2024 from 13:00 to 17:00.

The presentation held by Bärbel Kröger and Dr. Jörg Wettlaufer from Göttingen Academy of Science and Humanities in Lower Saxony introduces the use of the Wikidata platform, which serves as a central knowledge database in the field of Linked Open Data. The underlying Semantic Web standard will also be briefly explained to provide an understanding of the platform’s functionality and possibilities. In the second part of the lecture, the FactGrid platform will be presented. While it uses the same technical infrastructure as Wikidata, it focuses on the knowledge domain of historical research. Using practical examples from ecclesiastical history, the potential of both platforms, Wikidata and FactGrid, will be explored. The lecture aims to spark a discussion on how legal historical research might also benefit from open and interconnected datasets.



[...]

Quelle: https://dhd-blog.org/?p=21807

Weiterlesen

Vacancy Postdoctoral Researcher (DFG-AHRC)

The Professorship of Digital History at the Otto Friedrich University of Bamberg has a vacancy for a

Postdoctoral Research Fellow in Digital History (m/f/d)

(24-month fixed-term contract, 100% of regular working hours, pay group 13 TV-L)

This is a two-year temporary position starting March 2025 or as soon as possible thereafter.

We are seeking a highly qualified Postdoctoral Research Fellow to join our international research team. The postdoc will contribute to the „data upcycling“ process and its documentation as well as the digital analysis and enhancement of the London Customs Accounts (LCA).

The position is part of the DFG-AHRC-funded project „Unlocking Upcycled Medieval Data: North Sea Networks, People, and Commodities in the London Customs Accounts 1380-1560“, which is carried out in collaboration with the School of Advanced Study at the University of London. The London Customs Accounts (LCA) represent one of Europe’s largest surviving collections of medieval trade documents, comprising thousands of records with details about ships and commodities arriving from across Europe.

[...]

Quelle: https://dhd-blog.org/?p=21795

Weiterlesen

Stellenausschreibung: Doktorand für die Digitale Modellierung von datenintensiven Prozessen der historischen Forschung (m/w/d)

Die Arbeitsgruppe MEPHisto (Modelle, Prozesse und Erklärungen in den historischen Wissenschaften) an der Friedrich-Schiller-Universität Jena sucht zum 1.1.2025 für das Drittmittelprojekt „Forschungsdateninfrastruktur HisQu“ eine/n Doktorand für die Digitale Modellierung von datenintensiven Prozessen der historischen Forschung (m/w/d) mit einem Umfang von 100% der regelmäßigen Arbeitszeit (TV L E 13). Die Stelle ist teilzeitgeeignet und bis zum 31.12.2027 befristet.

Über das Projekt:

Das (im Rahmen des e-Research-Programms von der DFG zunächst für 3 Jahre geförderte) Forschungsprojekt „Forschungsdateninfrastruktur Historische Quellen (HisQu)“ an der Friedrich-Schiller-Universität Jena zielt darauf ab, neue Methoden und eine innovative digitale Infrastruktur zur
semantischen Erschließung historischer Quellen zu entwickeln.

[...]

Quelle: https://dhd-blog.org/?p=21714

Weiterlesen

Zum 20. Jubiläum: Romane des Deutschen Buchpreises jetzt für die Sprachforschung nutzbar

Die Deutsche Nationalbibliothek (DNB) und das Leibniz-Institut für Deutsche Sprache (IDS) bieten der Forschung Zugang zu einer besonderen Sammlung zeitgenössischer deutschsprachiger Literatur. Anlässlich des 20-jährigen Jubiläums des Deutschen Buchpreises sind nun alle digital verfügbaren 362 Longlist-Titel zu wissenschaftlichen Zwecken online im Volltext nach sprachlichen Mustern und Strukturen durchsuchbar.

Dank der Korpus-Analyseplattform KorAP, bereitgestellt vom Leibniz-Institut für Deutsche Sprache (IDS) und installiert auf der Infrastruktur der DNB, können Forschende in die Welt ausgezeichneter Literatur eintauchen. Die Texte sind automatisch mit detaillierten Annotationen versehen, die Informationen zu Grundform (Lemma) und Wortart (Part of Speech) jedes Wortes enthalten, was komplexe wissenschaftliche Suchanfragen ermöglicht. Forschende aus Linguistik und Germanistik haben damit die Möglichkeit, diese wertvolle Sammlung von Literatur digital zu erkunden und neue Erkenntnisse zu gewinnen.

Zur vollständigen Pressenachricht der DNB hier lang.

Zum Angebot: https://korap.

[...]

Quelle: https://dhd-blog.org/?p=21686

Weiterlesen

Stellenausschreibung: Softwareentwickler/in (m/w/d) am Deutschen Historischen Institut in Rom – Verlängerung der Bewerbungsfrist

Das Deutsche Historische Institut (DHI) in Rom

sucht für den Forschungsbereich Digital Humanities zum 1. Januar 2025 für einen befristeten Zeitraum von drei Jahren

eine*n wissenschaftliche*n Mitarbeiter*in (w/m/d) mit dem Schwerpunkt Softwareentwicklung

Das DHI Rom ist eine Einrichtung der in Bonn ansässigen Max Weber Stiftung – Deutsche Geisteswissenschaftliche Institute im Ausland. Es widmet sich der epochenübergreifenden, interdisziplinären Erforschung der italienischen und deutschen Geschichte und Musikgeschichte in ihren europäischen und globalen Bezügen vom Mittelalter bis heute.

Das innerhalb des e-research-Programms von der DFG zunächst für 3 Jahre geförderte Forschungsprojekt „Forschungsdateninfrastruktur Historische Quellen (HisQu)“ zielt darauf ab, neue Methoden und eine innovative digitale Infrastruktur zur semantischen Erschließung historischer Quellen zu entwickeln. In Zusammenarbeit mit renommierten Partnerinstitutionen wird dafür eine Plattform aufgebaut, die es ermöglicht, historische Forschungsprozesse digital gestützt, nachvollziehbar und reproduzierbar zu gestalten.

Im Rahmen dieses Vorhabens soll die bestehende Dateninfrastruktur des „Repertorium Germanicum“ (RG) weiterentwickelt und durch die in HisQu entstehenden Services ergänzt werden.

[...]

Quelle: https://dhd-blog.org/?p=21597

Weiterlesen

Umfrage zu Praktiken, Standards und Bedarfen im Bereich Datenqualität von NFDI4Memory

Die Task Area “Data Quality” des Konsortiums NFDI4Memory in der Nationalen Forschungsdateninfrastruktur (NFDI) möchte einen Überblick gewinnen, wie die Community der historisch arbeitenden Fächer die Qualität ihrer Daten gewährleistet, welche Standards sie hierbei verwendet und welche Bedarfe sie hat. 

Dazu haben wir eine Umfrage entworfen. Wir laden Sie herzlich ein, daran teilzunehmen:

https://www.herder-institut.de/limesurvey/index.php/899418?newtest=Y&lang=de

Diese Umfrage richtet sich daher an alle, die in den historisch arbeitenden Fächern Daten erzeugen, bearbeiten, speichern und nachnutzen.

[...]

Quelle: https://dhd-blog.org/?p=21580

Weiterlesen

Stellenausschreibung Softwareentwickler/in (m/w/d) an der Niedersächsischen Akademie der Wissenschaften zu Göttingen

An der Niedersächsischen Akademie der Wissenschaften zu Göttingen

ist zum 1. Januar 2025 in dem durch die Germania Sacra koordinierten Vorhaben „Forschungsdateninfrastruktur Historische Quellen (HisQu)“

die Stelle einer wissenschaftlichen Mitarbeiterin/eines wissenschaftlichen Mitarbeiters (w/m/d)

im Umfang 100 % (TV-L E13) zu besetzen. Die Stelle ist befristet bis zum 31. Dezember 2027. Sie ist teilzeitgeeignet.

Das im Rahmen des e-Research-Programms von der DFG zunächst für 3 Jahre geförderte Forschungsprojekt HisQu ist ein kollaboratives Vorhaben zur Entwicklung einer digitalen Infrastruktur für historische Quellen.

[...]

Quelle: https://dhd-blog.org/?p=21561

Weiterlesen

TextGrid Repository erneut mit dem CoreTrustSeal ausgezeichnet!

Das TextGrid Repository ist ein digitales Langzeitarchiv für geisteswissenschaftliche Forschungsdaten, das einen umfangreichen, durchsuch- und nachnutzbaren Bestand an Texten und Bildern liefert. Es ist an den Grundsätzen von Open Access und den FAIR-Prinzipien orientiert und fokussiert sich auf Texte in XML TEI, um vielfältige Szenarien der Nachnutzung zu unterstützen. Für Forschende bietet das TextGrid Repository eine nachhaltige, dauerhafte und sichere Möglichkeit zur zitierfähigen Publikation ihrer Forschungsdaten und zur verständlichen Beschreibung derselben durch erforderliche Metadaten. Mehr Informationen zum Thema Nachhaltigkeit, FAIR und Open Access befinden sich im Mission Statement des TextGrid Repository.

Der Bestand basiert auf dem Erwerb der Digitalen Bibliothek und wurde durch zahlreiche Editions- und Korpusprojekte erweitert. Dadurch befinden sich nun auch Manuskripte (Bilder) und Transkriptionen (XML/TEI-kodierte Textdaten) im TextGrid Repository, z.B. die Bibliothek der Neologie oder auch das Projekt zur deutsch-französischen Reisekorrespondenz ARCHITRAVE. Neue Texte im TextGrid Repository sind die Korpora der European Text Collection (ELTec) und das Corpus of Novels of the Spanisch Silver Age (CoNSSA) 



[...]

Quelle: https://dhd-blog.org/?p=21553

Weiterlesen