Bericht zum Workshop „(Generative) KI für Kultur- und Textdaten“, 4. und 5. November 2024, Goethe- und Schiller-Archiv, Weimar

Autor: Gerrit Brüning

Der Einsatz Künstlicher Intelligenz in den digitalen Geisteswissenschaften hat durch die Fortschritte im Bereich großer Sprachmodelle (LLMs) und insbesondere die Veröffentlichung von GPT-3.5 im November 2022 eine neue Stufe erreicht. Seither hat sich das methodische Feld durch multimodale Modelle, Retrieval Augmented Generation (RAG) und Integration graphbasierter Ansätze nochmals weiterentwickelt und ausdifferenziert. Die perspektivischen Einsatzszenarien reichen damit weit über Sprachverarbeitung und Textgenerierung hinaus. Die damit verbundenen innovativen und experimentellen Ansätze sind Teil eines größeren Spektrums etablierterer Formen maschinellen Lernens zur Lösung spezifischer Aufgaben (z.B. Bildanalyse, Handschriftenerkennung, Topic Modeling, Named Entity Recognition und andere NLP-Tasks). Sie regen aber auch zu ethischen Diskussionen, zur erneuten Betrachtung von hergebrachten Problemen der Philosophie des Geistes an und halten in Lehr-Lern-Situationen Einzug.



[...]

Quelle: https://dhd-blog.org/?p=21880

Weiterlesen

Call for Contributions zum Workshop “Text+: Digitale Forschung auf der Grundlage von Text- und Sprachdaten bereichern” auf der DHd-Konferenz 2025 in Bielefeld

Im Rahmen der Konferenz Digital Humanities im deutschsprachigen Raum (DHd) an der Universität Bielefeld findet am 03. und 04. März 2025 der Workshop “Text+: Digitale Forschung auf der Grundlage von Text- und Sprachdaten bereichern” statt, in dem hands-on ein Blick in das Angebotsportfolio von Text+ geworfen wird und der in Zusammenarbeit mit der Community offene Bedarfe eruiert.

Die Organisator:innen des Workshops ermutigen Teilnehmende, im Vorfeld ihre Bedarfe an Text+ zu adressieren, die über die bestehenden Angebote von Text+ hinausgehen. Dies können neue Tools, Softwarepipelines, Angebote zur Datenablage, Handreichungen, Schulungsangebote u.v.m. sein. Dazu zählen auch Erweiterungen von bestehenden Angeboten um weitere Features und Möglichkeiten.

[...]

Quelle: https://dhd-blog.org/?p=21852

Weiterlesen

Die Coordination Committees von Text+ wurden neu gewählt; das sind die Ergebnisse

 

Die Coordination Committees sind die zentralen Mitbestimmungsgremien der Fachcommunitys, die Text+ mit seinen Angeboten adressiert. Es gibt je ein Scientific Coordination Committee (SCC) für die drei Datendomänen Collections, Lexical Resources und Editions sowie das Operations Coordination Committee (OCC) für die Task Area Infrastructure/Operations. Wichtige Aufgaben der Coordination Committees sind die Evaluation des Angebotsportfolios von Text+, Empfehlungen zur Vergabe der flexiblen Fördermittel an Kooperationsprojekte sowie die bedarfsorientierte Vertretung der Communitys.

Die Komiteebesetzung für die nun folgende zweijährige Amtsperiode (2025–2026) wurde durch eine Wahl mit allen an Text+ beteiligten und Text+ unterstützenden Institutionen und Vereinigungen bestimmt.

Die Stimmen sind nun ausgezählt; folgende Vertreterinnen und Vertreter wurden von den Wahlberechtigten in die Coordination Committees gewählt (in alphabetischer Reihenfolge):

 



[...]

Quelle: https://dhd-blog.org/?p=21800

Weiterlesen

Stellenausschreibung: Doktorand für die Digitale Modellierung von datenintensiven Prozessen der historischen Forschung (m/w/d)

Die Arbeitsgruppe MEPHisto (Modelle, Prozesse und Erklärungen in den historischen Wissenschaften) an der Friedrich-Schiller-Universität Jena sucht zum 1.1.2025 für das Drittmittelprojekt „Forschungsdateninfrastruktur HisQu“ eine/n Doktorand für die Digitale Modellierung von datenintensiven Prozessen der historischen Forschung (m/w/d) mit einem Umfang von 100% der regelmäßigen Arbeitszeit (TV L E 13). Die Stelle ist teilzeitgeeignet und bis zum 31.12.2027 befristet.

Über das Projekt:

Das (im Rahmen des e-Research-Programms von der DFG zunächst für 3 Jahre geförderte) Forschungsprojekt „Forschungsdateninfrastruktur Historische Quellen (HisQu)“ an der Friedrich-Schiller-Universität Jena zielt darauf ab, neue Methoden und eine innovative digitale Infrastruktur zur
semantischen Erschließung historischer Quellen zu entwickeln.

[...]

Quelle: https://dhd-blog.org/?p=21714

Weiterlesen

Zum 20. Jubiläum: Romane des Deutschen Buchpreises jetzt für die Sprachforschung nutzbar

Die Deutsche Nationalbibliothek (DNB) und das Leibniz-Institut für Deutsche Sprache (IDS) bieten der Forschung Zugang zu einer besonderen Sammlung zeitgenössischer deutschsprachiger Literatur. Anlässlich des 20-jährigen Jubiläums des Deutschen Buchpreises sind nun alle digital verfügbaren 362 Longlist-Titel zu wissenschaftlichen Zwecken online im Volltext nach sprachlichen Mustern und Strukturen durchsuchbar.

Dank der Korpus-Analyseplattform KorAP, bereitgestellt vom Leibniz-Institut für Deutsche Sprache (IDS) und installiert auf der Infrastruktur der DNB, können Forschende in die Welt ausgezeichneter Literatur eintauchen. Die Texte sind automatisch mit detaillierten Annotationen versehen, die Informationen zu Grundform (Lemma) und Wortart (Part of Speech) jedes Wortes enthalten, was komplexe wissenschaftliche Suchanfragen ermöglicht. Forschende aus Linguistik und Germanistik haben damit die Möglichkeit, diese wertvolle Sammlung von Literatur digital zu erkunden und neue Erkenntnisse zu gewinnen.

Zur vollständigen Pressenachricht der DNB hier lang.

Zum Angebot: https://korap.

[...]

Quelle: https://dhd-blog.org/?p=21686

Weiterlesen

1st Base4NFDI User Conference (20-21 November 2024 at Fraunhofer FOKUS, Berlin): Registration open, Abstracts published

Base4NFDI is an initiative that will develop and offer a set of common shared RDM enabling services to the NFDI community. Base4NFDI supports this via an iterative three-step process, allowing a participatory path to roll-out and, importantly, gaining consensus from the NFDI community along the way. Base4NFDI will have a number of basic services at different stages of technical fruition by November 2024. 

The aim of this two-day event is:

To showcase the basic services and allow the audience to understand the service offering, examine how they can integrate the service into the NFDI community, and critically evaluate what this means in real-terms in terms of technical interoperability and local policies. The interactive programme will cover aspects of the different services, get insights from the institutions who will support their take-up as well as issues such as alignment with other infrastructures both nationally and at European level.

Who is this conference aimed at:

  • Members of NFDI who are interested in consortia-wide buy-in to a particular service


  • [...]

Quelle: https://dhd-blog.org/?p=21666

Weiterlesen

Die Koordinationskomitees von Text+ werden neu gewählt

Die zweijährlich stattfindenden Wahlen der Koordinationskomitees von Text+ stehen an. Der Wahltermin ist der 6. November 2024. Die Wahl wird über ein elektronisches System erfolgen und eine Stimmabgabe vom Wahltermin bis zum 13. November 2024 ermöglichen.

Die Koordinationskomitees (https://text-plus.org/ueber-uns/governance/) sind die zentralen Mitbestimmungsgremien der Text+ Communitys. Sie setzen sich aus drei verschiedenen Scientific Coordination Committees, die jeweils für eine der Datendomänen (Collections, Editions, Lexical Resources) zuständig sind, und einem Operations Coordination Committee zusammen. Ihre Aufgabe ist es, kontinuierlich das Portfolio an Daten, Werkzeugen und Services zu evaluieren und zu erweitern.

[...]

Quelle: https://dhd-blog.org/?p=21587

Weiterlesen

TextGrid Repository erneut mit dem CoreTrustSeal ausgezeichnet!

Das TextGrid Repository ist ein digitales Langzeitarchiv für geisteswissenschaftliche Forschungsdaten, das einen umfangreichen, durchsuch- und nachnutzbaren Bestand an Texten und Bildern liefert. Es ist an den Grundsätzen von Open Access und den FAIR-Prinzipien orientiert und fokussiert sich auf Texte in XML TEI, um vielfältige Szenarien der Nachnutzung zu unterstützen. Für Forschende bietet das TextGrid Repository eine nachhaltige, dauerhafte und sichere Möglichkeit zur zitierfähigen Publikation ihrer Forschungsdaten und zur verständlichen Beschreibung derselben durch erforderliche Metadaten. Mehr Informationen zum Thema Nachhaltigkeit, FAIR und Open Access befinden sich im Mission Statement des TextGrid Repository.

Der Bestand basiert auf dem Erwerb der Digitalen Bibliothek und wurde durch zahlreiche Editions- und Korpusprojekte erweitert. Dadurch befinden sich nun auch Manuskripte (Bilder) und Transkriptionen (XML/TEI-kodierte Textdaten) im TextGrid Repository, z.B. die Bibliothek der Neologie oder auch das Projekt zur deutsch-französischen Reisekorrespondenz ARCHITRAVE. Neue Texte im TextGrid Repository sind die Korpora der European Text Collection (ELTec) und das Corpus of Novels of the Spanisch Silver Age (CoNSSA) 



[...]

Quelle: https://dhd-blog.org/?p=21553

Weiterlesen

Bleibt alles anders: 10 Jahre correspSearch

Seit 2014 sammelt correspSearch die Metadaten von edierten Briefen und stellt sie zur projektübergreifenden Recherche bereit. Pünktlich zum runden Geburtstag gibt es jetzt neue Features: Visualisierungen, Volltextsuche und einen SPARQL-Endpoint. Über 270.000 edierte Briefe sind recherchierbar. Grund genug, nicht nur die neuen Funktionen vorzustellen, sondern auch zurück zu blicken und zu schauen, was noch kommt.

Von Stefan Dumont, Sascha Grabsch, Jonas Müller-Laackman, Ruth Sander und Steven Sobkowski

Blick zurück

Vor zehn Jahren, genauer gesagt am 1. September 2014, ging correspSearch mit einer E-Mail an die TEI-Liste und einem DHd-Blogpost offiziell online.

[...]

Quelle: https://dhd-blog.org/?p=21452

Weiterlesen

Call for Posters: Text+ Plenary 2024 in Mannheim

Am 10. und 11. Oktober 2024 trifft sich das Text+ Konsortium zu einer Konferenz mit allen Mitarbeitenden und Interessierten, darunter auch Delegierte aus Fachverbänden und -verbünden, um sich über den Projektfortschritt und die aktuellen Entwicklungen auszutauschen. Die diesjährige Konferenz zum Thema „Große Sprachmodelle (Large Language Models, LLMs) und deren Nutzung“ findet in den Räumen des Schlosses in Mannheim statt.

Im Rahmen einer Postersession wird es die Gelegenheit geben, einem breiten Fachpublikum aktuelle Forschungsergebnisse zum Thema LLMs und deren Nutzung zu präsentieren.  Insbesondere sollen die folgenden Schwerpunkte berücksichtigt werden:

  • Datenintegration in LLMs,
  • Domänenanpassung,
  • Wissensextraktion,


  • [...]

Quelle: https://dhd-blog.org/?p=21339

Weiterlesen
1 2 3 34