Vortrag: Wie funktioniert OCR? Grundlagen, Stand der Technik und aktuelle Herausforderungen. Clemens Neudecker (Staatsbibliothek zu Berlin)

Texterkennung (Optical Character Recognition, OCR) ist die Technologie um aus Scans (also Bildern) von Dokumenten digitale, editierbare und durchsuchbare Volltexte zu erzeugen. Sowohl durch Digital Humanities als auch Künstliche Intelligenz steigt der Bedarf von Wissenschaft und Forschung an digitalen Texten. Jedoch ist die Texterkennung, insbesondere für historische Dokumente, noch stets eine sowohl technisch als auch organisatorisch hoch komplexe Aufgabe. Der Vortrag hat daher zum Ziel die Grundlagen, technischen Verfahren und den aktuellen Stand der Entwicklungen im Bereich der OCR vorzustellen um so einen gründlichen Überblick über die Möglichkeiten und Herausforderungen zu geben. Dabei werden neben Ursprung und Geschichte der OCR insbesondere die vielfältigen Verarbeitungsschritte in einem typischen OCR-Workflow, die besonderen Anforderungen von historischem Material sowie aktuelle Forschungsprojekte und technologische Entwicklungen im Zentrum stehen.

Clemens Neudecker arbeitet als Forscher, Projektmanager und Library Hacker an der Staatsbibliothek zu Berlin. Er ist dort unter anderem eingebunden in das umfangreiche Verbundprojekt OCR-D. Seine Arbeitsschwerpunkte sind Computer Vision, Natural Language Processing, Machine Learning & Artificial Intelligence und ihr Einsatz in den Bereichen Digitale Bibliotheken und Digital Humanities.



[...]

Quelle: https://dhd-blog.org/?p=20564

Weiterlesen

Stellenausschreibung an der Herzog August Bibliothek Wolfenbüttel: Wissenschaftliche(n) Mitarbeiterin / Mitarbeiter (0,5 Entgeltgruppe 13 TV-L)

An der HAB Wolfenbüttel ist im Rahmen des von der DFG geförderten Projektes „DE ANIMA – Digitale Edition & Analyse eines neu entdeckten jesuitischen Manuskripts:
Das Wolfenbütteler Manuskript der jesuitischen Compendia der Philosophie, Theologie und Kosmologie in japanischer Übersetzung (ca. 1595)“ zum nächstmöglichen Zeitpunkt eine auf drei Jahre befristete Teilzeitstelle (50%) einer / eines Wissenschaftlichen Mitarbeiterin / Mitarbeiters (m/w/d)
(Entgeltgruppe 13 TV-L) zu besetzen. Die wöchentliche Arbeitszeit beträgt zzt. 19,90 Wochenstunden. Gewünschter Arbeitsbeginn ist der 01.04.2024. Die Stelle bezieht sich auf verschiedene Aufgaben im Zusammenhang mit der Entwicklung der digitalen Edition durch die Herzog August Bibliothek (HAB) und die Ruhr-Universität Bochum (RUB).
Die Herzog August Bibliothek Wolfenbüttel ist eine zentrale Institution zur Erforschung der Kulturgeschichte des Mittelalters und der frühen Neuzeit. Sie besitzt bedeutende Sammlungen an Handschriften und alten Drucken sowie einen umfassenden Bestand moderner Forschungsliteratur.

[...]

Quelle: https://dhd-blog.org/?p=20561

Weiterlesen

Abschlussworkshop des DFG-Netzwerks „Offenes Mittelalter“

Unter dem Titel „Offenes Mittelalter“ lädt das gleichnamige DFG-Netzwerk zu seinem Abschlusstreffen ein, in dem es um einen Austausch über vernetzte Ressourcen und ihr Potenzial für die germanistische Mediävistik geht. Neben einem Bericht der Aktivitäten des DFG-Netzwerks gibt es verschiedene Impulsvorträge und eine Panel-Diskussion.

Offenes Mittelalter

Unter dem Titel „Offenes Mittelalter“ lädt das gleichnamige DFG-Netzwerk zu seiner Abschlusskonferenz am 20. Februar 2024 im Georg-Christoph-Lichtenberghaus in Darmstadt ein, in dem es um einen Austausch über vernetzte Ressourcen und ihr Potenzial für die germanistische Mediävistik geht. Neben einem Bericht der Aktivitäten des DFG-Netzwerks gibt es verschiedene Impulsvorträge und eine Panel-Diskussion zu Linked Open Data in der mediävistischen Forschung.

Ganz im Sinne eines offenen Mittelalters richtet sich die Konferenz an ein interdisziplinäres Publikum und ist aufgrund der Übertragbarkeit der besprochenen Methoden nicht auf eine Epoche festgelegt.

Interessierte sind herzlich eingeladen!

[...]

Quelle: https://dhd-blog.org/?p=20554

Weiterlesen

Stellenausschreibung: Bibliotheksreferendar (w/m/d) – UB Heidelberg

Die Universitätsbibliothek Heidelberg stellt zum 1. Oktober 2024 einen Bibliotheksreferendar (w/m/d) für den höheren Bibliotheksdienst an wissenschaftlichen Bibliotheken mit dem fachlichen Schwerpunkt Digital Humanities ein. (Bewerbungsfrist: 08. März 2024).

Wissenschaftliche Bibliothekar*innen arbeiten als Informationsspezialist*innen an der Schnittstelle zwischen Forschung bzw. Lehre und Bibliothek. Zentrale Aufgabenbereiche sind die fachbezogene Auswahl und Erschließung wissenschaftlicher Literatur, die Mitarbeit im Bibliotheksmanagement, Publikations- und Forschungsdatenmanagement sowie die Vermittlung von Informationskompetenz.

Die Universitätsbibliothek Heidelberg ist Kompetenz- und Steuerungszentrum für alle bibliothekarischen Geschäftsprozesse an der Universität Heidelberg und betreut das gesamte Fächerspektrum einer Volluniversität mit ausgeprägter Forschungsorientierung und internationalem Anspruch.

[...]

Quelle: https://dhd-blog.org/?p=20547

Weiterlesen

Stellenausschreibung: FU Berlin sucht Wissenschaftl. Mitarbeit für das Datenkompetenzzentrum QUADRIGA

Das BMBF-geförderte Datenkompetenzzentrum QUADRIGA vereint die vier Disziplinen Digital Humanities, Verwaltungswissenschaft, Informatik und Informationswissenschaft entlang der Datentypen Text, Tabelle und Bewegtes Bild am Wissenschaftsstandort Berlin-Brandenburg. Der inhaltliche Ansatz des an sieben renommierten Berlin-Brandenburgischen Hochschulen und Forschungseinrichtungen entstehenden Datenkompetenzzentrums führt Forschungs-, Lern- und Vernetzungsorte über datenbasierte Fallstudien und Bildungsangebote zusammen: So werden für Forschende aller Karrierestufen Ressourcen für den souveränen Umgang mit Daten im Forschungsalltag geschaffen.

Die Freie Universität leitet das Arbeitspaket “Forschungsorte” mit dem dort angesiedelten Teilvorhaben “Digital Humanities für Text und Bewegtes Bild” sowie das Arbeitspaket “Verstetigung”, das die Entwicklung eines Konzepts für die dauerhafte Zugänglichkeit der im Vorhaben entstehenden Bildungsangebote koordiniert.

Für das an der Universitätsbibliothek der Freien Universität angesiedelte Teilprojekt „Verstetigung“ suchen wir zum nächstmöglichen Zeitpunkt eine*n Wissenschaftliche*n Mitarbeiter*in (m/w/d, TV-L E13, 50% VZÄ, 36PM) mit folgenden Aufgaben:

Sie evaluieren und konzipieren Maßnahmen zur dauerhaften Zugänglichkeit der in QUADRIGA entstehenden digitalen Bildungsangebote. Sie erarbeiten Modelle für den langfristigen Betrieb des Datenkompetenzzentrums, die frühzeitige und nachhaltige Verfügbarmachung von Inhalten und Ressourcen nach den Paradigmen von FAIR und Open Research sowie Konzepte für die Vernetzung mit anderen geisteswissenschaftlichen Datenkompetenzzentren. Dabei können Sie auf die bereits an den Verbund-Einrichtungen bestehenden Angebote und Vorarbeiten zurückgreifen. Sie tragen aktiv dazu bei, Datenkompetenzen in den text- und bildbasierten Digital Humanities in der Region zu institutionalisieren und dauerhaft zugänglich zu machen.



[...]

Quelle: https://dhd-blog.org/?p=20527

Weiterlesen

Zweites FAIR February Meetup – Let’s talk FAIR Digital Editions ab 1. Februar

 
Im FAIR February widmet sich Text+ einen Monat lang wöchentlich in einer virtuellen Veranstaltung den vier FAIR-Prinzipien Findability, Accessibility, Interoperability und Reusability, die sich seit ihrer Veröffentlichung 2016 zu Leitprinzipien innerhalb der Digital Humanities entwickelt haben.
 
 
 

FAIR February 2024 / Veranstaltungsreihe des NFDI-Konsortiums Text+

Zweites FAIR February Meetup – Let’s talk FAIR Digital Editions

In der Task Area Editions des NFDI-Konsortiums Text+ wird das Know-how digital und interdisziplinär arbeitender Wissenschaftler:innen gebündelt mit dem Ziel, die Forschungsdateninfrastruktur für digitale Editionen zu verbessern.
 
Im FAIR February widmet sich Text+ einen Monat lang wöchentlich in einer virtuellen Veranstaltung den vier FAIR-Prinzipien Findability, Accessibility, Interoperability und Reusability. Mit der virtuellen Veranstaltungsreihe, die im Februar 2023 ihren Anfang nahm, wenden wir uns an Forschende und Mitarbeitende von laufenden oder geplanten Editionsprojekten, analog wie digital sowie an Interessierte aus den Digital Humanities, um über die FAIR-Prinzipien und ihre Anwendung im Kontext wissenschaftlicher Editionen zu diskutieren:
 
  • Was bedeuten die einzelnen Prinzipien ganz konkret für Editionen?
  • Welche Unklarheiten und Lücken gibt es?
  • An welcher Stelle bedarf es einer Ausdifferenzierung?
 
Erste Gesprächsimpulse geben Expert:innen verschiedener Fachbereiche aus technischer, editionswissenschaftlicher und bibliothekarischer Sicht.

[...]

Quelle: https://dhd-blog.org/?p=20506

Weiterlesen

Nachholtermin: Einladung zum 7. Community Forum 02.02.2024

Liebe Mitglieder des DHd-Verbandes und Interessierte,

für unsere interdisziplinäre Community ist ein offener Austausch von großer Bedeutung. Während die jährliche Mitgliederversammlung bereits eine wichtige Rolle für unsere communityinterne Verständigung übernimmt, unterstützen wir als Vorstand weitere partizipative Angebote. Alle Mitglieder und Interessierte sind herzlich eingeladen, sich an den Diskussionen zu beteiligen sowie Themenvorschläge (info@dig-hum.de) einzureichen.

Das nächste virtuelle Community Forum findet am Freitag, dem 2. Februar 2024 von 14–15 Uhr statt. Das von uns vorgeschlagene Thema lautet “Reviewverfahren von DHd-Konferenzbeiträgen”. Wir möchten das Community Forum dieses Mal nutzen, um uns über Erfahrungen und Herausforderungen des Reviewing auszutauschen.

[...]

Quelle: https://dhd-blog.org/?p=20509

Weiterlesen

6. Expert:innenforum „Nachhaltige Softwareentwicklung in NFDI4Culture”: Ökologische Nachhaltigkeit von Softwareentwicklung und -gebrauch

verfasst von: Aleksander Marcic (ORCID), Daniel Jettka (ORCID), Anne Ferger (ORCID)

Einführung

Am 01. Dezember 2023 kam das Expert:innenforum „Nachhaltige Softwareentwicklung in NFDI4Culture“ zu seinem mittlerweile sechsten halbjährlichen Treffen zusammen. Anlässlich der fortgeschrittenen Anzahl bereits absolvierter Forumstreffen war es an der Zeit, ein Resümee zum bisherigen Verlauf des Forums zu ziehen, aber auch einen Blick in die Zukunft zu richten mit dem für diesen Termin ausgewählten Fokusthema „Ökologische Nachhaltigkeit von Softwareentwicklung und -gebrauch“ .

In der kurzen Feedbackrunde zu Beginn des Forums zeigten sich die Expert:innen im Wesentlichen einig darüber, dass das Forum thematisch und organisatorisch sehr gut aufgestellt ist und lediglich geringer Anpassungsbedarf hinsichtlich der eingesetzten Kommunikationsmittel für die Organisation und den Austausch zwischen den Forumsterminen besteht. Entsprechend wird die Kommunikation via E-Mail wieder eine stärkere Rolle einnehmen, und der eigens für das Forum eingerichtete Chat-Kanal voraussichtlich sehr viel weniger bis gar nicht mehr genutzt werden.

Etwas weniger eindeutig als das Feedback zum Gesamtverlauf des Forums sind jedoch, wie zu erwarten, die Antworten bzw. Überlegungen auf die Fragen ausgefallen, die sich im Zusammenhang mit ökologischer Nachhaltigkeit in der Softwareentwicklung stellen, wie etwa: Welches Wissen ist notwendig, um Softwareentwicklung möglichst ökologisch nachhaltig zu gestalten?

[...]

Quelle: https://dhd-blog.org/?p=20499

Weiterlesen

Vortrag: Text-Reuse-Detection: Ein Werkzeug für die textorientierten Wissenschaften? Frederik Arnold, Robert Jäschke, Philip Kraut, Steffen Martus (HU Berlin), 18.01.2024, Humboldt-Universität zu Berlin

Zitate sind ein wichtiges Indiz für intertextuelle Verhältnisse. Insbesondere direkte, wörtliche Übernahmen weisen auf Stellen hin, die so bedeutend sind, dass sie nicht in ‘eigenen Worten’ wiedergegeben werden können oder durch eigene Worte ersetzt werden sollen. In unseren Projekten zur Identifikation von “Schlüsselstellen” sowie zur (Nach-)Nutzung vorhandenen Expert*innenwissens in den Computational Literary Studies haben wir Verfahren zur Text-Reuse-Detection entwickelt, die sich insbesondere auf die bislang systematisch ungeklärte Beziehung von Quellen und wissenschaftlichen Texten konzentrieren, aber auch andere Formen von Intertextualität erfassen.

Steffen Martus ist Professor für Neuere deutsche Literatur am Institut für deutsche Literatur der Humboldt–Universität zu Berlin. Seine Forschungsschwerpunkte liegen in der Literaturgeschichte vom 18. Jahrhundert bis zur Gegenwart, in der Literaturtheorie (insbesondere Theorien des literarischen Werks) sowie der Wissenschaftstheorie und -geschichte der Geisteswissenschaften. Im Rahmen des DFG-Schwerpunktprogramms 2207 Computational Literary Studies leitet er gemeinsam mit Rober Jäschke ein Projekt zu Schlüsselstellen in der Literatur (2020-2026). Gemeinsam mit Jörn Kreutel (Berliner Hochschule für Technik) leitet er das DFG-Projekt „Forschungsplattform Literarisches Feld DDR: Autor*innen, Werke, Netzwerke“.



[...]

Quelle: https://dhd-blog.org/?p=20486

Weiterlesen

Wissenschaftliche:r Mitarbeiter:in im Projekt „Historische Fremdsprachenlehrwerke digital. Sprachgeschichte, Sprachvorstellungen und Alltagskommunikation im Kontext der Mehrsprachigkeit im Europa der Frühen Neuzeit“ (FSL digital) § 28 Abs. 3 HmbHG

Einrichtung: Universität Hamburg, Fakultät für Geisteswissenschaften, Institut für Germanistik
Wertigkeit: E 13
Arbeitsbeginn: 01.04.2024
Befristungsende: 31.03.2027, eine Verlängerung wird angestrebt
Bewerbungsschluss: 15.02.2024
Arbeitsumfang: teilzeitgeeignete Vollzeitstelle

Ihre Aufgaben
Die Aufgaben umfassen wissenschaftliche Dienstleistungen im o. g. Projekt. Außerhalb der Dienstaufgaben besteht Gelegenheit zur wissenschaftlichen Weiterbildung.

[...]

Quelle: https://dhd-blog.org/?p=20446

Weiterlesen