Wie man Volltext aus gescannten handschriftlichen Quellen extrahiert: Video-Tutorials über Automatische Texterkennung jetzt online

Die manuelle Transkription handschriftlicher oder gedruckter Quellen ist häufig zeitaufwändig und bei größeren Korpora oft nicht durchführbar. Automatische Texterkennung (ATR) kann hierbei entscheidend helfen, Volltext aus gescannten Bildern zu extrahieren. Die entsprechende Software wie Transkribus, eScriptorium, OCR4all, OCR-D und andere entwickeln sich rasant und liefern mit ihren großen Modellen oft erstaunliche Ergebnisse.

Der Teaser zu den sechs Videos, v.l.n.r.: Pauline Spychala, David Lassner, Hippolyte Souvay, Hugo Scheithauer, Floriane Chiffoleau und Sarah Ondraszek.

Dennoch ist es nicht ganz einfach, wenn man vor der Herausforderung steht, automatische Texterkennung anwenden zu wollen, zumal wenn es sich um ein großes Korpus handelt.

[...]

Quelle: https://dhdhi.hypotheses.org/9053

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 24.06.2024: „Vom anderen Geschlecht zu anderen Geschlechter. Jenseits der Banalität – Über die literaturwissenschaftliche Genderanalyse in historischen und modernen Klassikern.“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 24. Juni 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Marie Flüh (Uni Hamburg) und Mareike Schumacher (Uni Stuttgart)

In unserem Vortrag zeigen wir anhand von zwei Fallstudien, wie die Klassifikation von Genderaspekten in literarischen Texten mithilfe der Methoden der Computational Literary Studies umgesetzt werden kann. Ausgehend von der Frage, was typische Genderdarstellungen sind und wann diese brüchig werden, untersuchen wir unterschiedliche Korpora: Im Fokus dieses Vortrags steht sowohl ein historisches Korpus mit Texten, die von Simone de Beauvoir anlässlich ihrer Studie “Das andere Geschlecht” (1949) analysiert wurden, als auch ein zeitgenössisches Korpus mit den Romanen der Harry-Potter-Serie (1997–2000). Mit der analytische Reise vom “anderen Geschlecht” nach Hogwarts geben wir Einblicke in unser Forschungsprojekt m*w/DISKO und zeigen eine genre- und zeitunabhängige Überrepräsentation männlicher Figuren-Referenzen.

[...]

Quelle: https://dhd-blog.org/?p=21160

Weiterlesen

10 Jahre RIDE – still enjoying the ride

Genau vor 10 Jahren, am 20. Juni 2014, erschien die erste Ausgabe der Rezensionszeitschrift RIDE – A Review Journal for Digital Editions and Resources, herausgegeben vom Institut für Dokumentologie und Editorik (IDE). Während wir den 10ten Geburtstag auf Mastodon im Fediverse von unserem IDE-Account unter dem Hashtag #10YearsRIDE feieren, wurde der Launch der digitalen Zeitschrift damals u. a. auf Twitter mit einem eher unscheinbaren Post (siehe Abb. 1) beworben. So manch einer fragte sich schon damals, wie man RIDE eigentlich ausspricht: /ri:de/ (Deutsch) oder /raɪd/ (Englisch)? Für die aufmerksamen Leser:innen werden wir das Geheimnis am Ende dieses Posts lüften.

Tweet, der den Launch von RIDE am 20.6.2014 verkündet.

Abb.

[...]

Quelle: https://dhd-blog.org/?p=21078

Weiterlesen

Einladung an die DHd-Mitglieder zum Community Forum 05.07.2024

Liebe Mitglieder des DHd-Verbandes und Interessierte,

für unsere interdisziplinäre Community ist ein offener Austausch von großer Bedeutung. Während die jährliche Mitgliederversammlung bereits eine wichtige Rolle für unsere communityinterne Verständigung übernimmt, unterstützen wir als Vorstand weitere partizipative Angebote. Alle Mitglieder und Interessierte sind herzlich eingeladen, sich an den Diskussionen zu beteiligen sowie Themenvorschläge (info@dig-hum.de) einzureichen.

Das nächste virtuelle Community Forum findet am Freitag, dem 5. Juli 2024 von 14–15 Uhr statt. Gegenstand des Community Forums ist der im Dezember 2023 veröffentlichte Code of Conduct der  Alliance of Digital Humanities Organizations (ADHO). Wir möchten das Community Forum nutzen, um mit Ihnen über mögliche Änderungsbedarfe für den DHd- Verband zu sprechen.

[...]

Quelle: https://dhd-blog.org/?p=21155

Weiterlesen