Virtuelles DH-Kolloquium an der BBAW, 28.10.2024: „fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 28. Oktober 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Timm Lehmberg (Akademie der Wissenschaften in Hamburg)
über
fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH

***

Der Beitrag führt in die Methoden der Retrieval Augmented Generation (RAG) ein, einem mittlerweile auch in den Digital Humanities verbreiteten Verfahren, das es ermöglicht, auf eigene Datenquellen mithilfe großer Sprachmodelle (Large Language Models, LLMs)  zuzugreifen. Ziel der Mehrzahl der Anwendungsfälle ist dabei zumeist, fachspezifische Abfragen und Analysen (nicht selten unter Verwendung eingeschränkt zugänglicher lokaler Datenbestände) per Chat Prompting durchzuführen.

[...]

Quelle: https://dhd-blog.org/?p=21698

Weiterlesen

1st Base4NFDI User Conference (20-21 November 2024 at Fraunhofer FOKUS, Berlin): Registration open, Abstracts published

Base4NFDI is an initiative that will develop and offer a set of common shared RDM enabling services to the NFDI community. Base4NFDI supports this via an iterative three-step process, allowing a participatory path to roll-out and, importantly, gaining consensus from the NFDI community along the way. Base4NFDI will have a number of basic services at different stages of technical fruition by November 2024. 

The aim of this two-day event is:

To showcase the basic services and allow the audience to understand the service offering, examine how they can integrate the service into the NFDI community, and critically evaluate what this means in real-terms in terms of technical interoperability and local policies. The interactive programme will cover aspects of the different services, get insights from the institutions who will support their take-up as well as issues such as alignment with other infrastructures both nationally and at European level.

Who is this conference aimed at:

  • Members of NFDI who are interested in consortia-wide buy-in to a particular service


  • [...]

Quelle: https://dhd-blog.org/?p=21666

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 30.09.2024: „Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. September 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christian Reul (Universität Würzburg)
über
Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz

***

Ein zentraler Aspekt der Arbeit von geistes- und kulturwissenschaftlich Forschenden ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen häufig lediglich als Scans vor, aus denen zunächst maschinenverarbeitbarer Volltext extrahiert werden muss, wozu Methoden der automatischen Texterkennung zum Einsatz kommen.

[...]

Quelle: https://dhd-blog.org/?p=21575

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 30.09.2024: „Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. September 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christian Reul (Universität Würzburg)
über
Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz

***

Ein zentraler Aspekt der Arbeit von geistes- und kulturwissenschaftlich Forschenden ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen häufig lediglich als Scans vor, aus denen zunächst maschinenverarbeitbarer Volltext extrahiert werden muss, wozu Methoden der automatischen Texterkennung zum Einsatz kommen.

[...]

Quelle: https://dhd-blog.org/?p=21575

Weiterlesen

TextGrid Repository erneut mit dem CoreTrustSeal ausgezeichnet!

Das TextGrid Repository ist ein digitales Langzeitarchiv für geisteswissenschaftliche Forschungsdaten, das einen umfangreichen, durchsuch- und nachnutzbaren Bestand an Texten und Bildern liefert. Es ist an den Grundsätzen von Open Access und den FAIR-Prinzipien orientiert und fokussiert sich auf Texte in XML TEI, um vielfältige Szenarien der Nachnutzung zu unterstützen. Für Forschende bietet das TextGrid Repository eine nachhaltige, dauerhafte und sichere Möglichkeit zur zitierfähigen Publikation ihrer Forschungsdaten und zur verständlichen Beschreibung derselben durch erforderliche Metadaten. Mehr Informationen zum Thema Nachhaltigkeit, FAIR und Open Access befinden sich im Mission Statement des TextGrid Repository.

Der Bestand basiert auf dem Erwerb der Digitalen Bibliothek und wurde durch zahlreiche Editions- und Korpusprojekte erweitert. Dadurch befinden sich nun auch Manuskripte (Bilder) und Transkriptionen (XML/TEI-kodierte Textdaten) im TextGrid Repository, z.B. die Bibliothek der Neologie oder auch das Projekt zur deutsch-französischen Reisekorrespondenz ARCHITRAVE. Neue Texte im TextGrid Repository sind die Korpora der European Text Collection (ELTec) und das Corpus of Novels of the Spanisch Silver Age (CoNSSA) 



[...]

Quelle: https://dhd-blog.org/?p=21553

Weiterlesen

Bleibt alles anders: 10 Jahre correspSearch

Seit 2014 sammelt correspSearch die Metadaten von edierten Briefen und stellt sie zur projektübergreifenden Recherche bereit. Pünktlich zum runden Geburtstag gibt es jetzt neue Features: Visualisierungen, Volltextsuche und einen SPARQL-Endpoint. Über 270.000 edierte Briefe sind recherchierbar. Grund genug, nicht nur die neuen Funktionen vorzustellen, sondern auch zurück zu blicken und zu schauen, was noch kommt.

Von Stefan Dumont, Sascha Grabsch, Jonas Müller-Laackman, Ruth Sander und Steven Sobkowski

Blick zurück

Vor zehn Jahren, genauer gesagt am 1. September 2014, ging correspSearch mit einer E-Mail an die TEI-Liste und einem DHd-Blogpost offiziell online.

[...]

Quelle: https://dhd-blog.org/?p=21452

Weiterlesen

DH-Professuren im deutschsprachigen Raum visualisiert

Jan Horstmann (Universität Münster), Christof Schöch (Universität Trier)

Die Etablierung der Digital Humanities lässt sich anhand mehrerer Merkmale beobachten und analysieren, z.B. der Publikation DH-bezogener Forschungsbeiträge, der Bewilligung und Förderung von DH-Projekten, der Etablierung von Studiengängen mit Anteilen von oder explizitem Fokus auf DH, der Gründung von DH-Forschungszentren und – last but not least – der Ausschreibung und Besetzung von DH-Professuren. Für den deutschsprachigen Raum hat sich Patrick Sahles laufend aktualisierter Blogbeitrag „Professuren für Digital Humanities“ (https://dhd-blog.org/?p=11018; Zugriff: 08.07.2024) als eine zentrale Anlaufstelle herauskristallisiert: Er verzeichnet die seit 2008 ausgeschriebenen DH- (oder DH-bezogenen) Professuren im deutschsprachigen Raum, derzeit 139 an der Zahl. In quantitativer Hinsicht lässt sich dort ein guter Überblick gewinnen, etwa wie viele DH-Professuren pro Jahr ausgeschrieben wurden (bislang ist das Jahr 2021 mit 16 Ausschreibungen der Titelverteidiger).

[...]

Quelle: https://dhd-blog.org/?p=21260

Weiterlesen

10 Jahre RIDE – still enjoying the ride

Genau vor 10 Jahren, am 20. Juni 2014, erschien die erste Ausgabe der Rezensionszeitschrift RIDE – A Review Journal for Digital Editions and Resources, herausgegeben vom Institut für Dokumentologie und Editorik (IDE). Während wir den 10ten Geburtstag auf Mastodon im Fediverse von unserem IDE-Account unter dem Hashtag #10YearsRIDE feieren, wurde der Launch der digitalen Zeitschrift damals u. a. auf Twitter mit einem eher unscheinbaren Post (siehe Abb. 1) beworben. So manch einer fragte sich schon damals, wie man RIDE eigentlich ausspricht: /ri:de/ (Deutsch) oder /raɪd/ (Englisch)? Für die aufmerksamen Leser:innen werden wir das Geheimnis am Ende dieses Posts lüften.

Tweet, der den Launch von RIDE am 20.6.2014 verkündet.

Abb.

[...]

Quelle: https://dhd-blog.org/?p=21078

Weiterlesen

ediarum.MEETUP – nächste virtuelle Veranstaltung am 10.06.2024

Liebe ediarum-Community, liebe ediarum-Interessierte, liebe Kolleg:innen!

im Namen des Konsortiums Text+ der Nationalen Forschungsdateninfrastruktur (NFDI) und des ediarum-Teams an der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) laden wir Sie herzlich zum nächsten virtuellen ediarum.MEETUP mit einem Projektbericht aus Würzburg ein:

am Montag, dem 10. Juni 2024, 11:00 Uhr s.t.

Das Zentrum für Philologie und Digitalität der Universität Würzburg betreut die technischen Aspekte verschiedener digitaler Editionsprojekte. Eine der Grundlagen hierfür stellt das ediarum-Ökosystem dar.

[...]

Quelle: https://dhd-blog.org/?p=21007

Weiterlesen

Nächste Offene OCR-Sprechstunde am 14. März von 15 bis 16 Uhr

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 14. März 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20654

Weiterlesen
1 2 3 6