Wie man Volltext aus gescannten handschriftlichen Quellen extrahiert: Video-Tutorials über Automatische Texterkennung jetzt online

Die manuelle Transkription handschriftlicher oder gedruckter Quellen ist häufig zeitaufwändig und bei größeren Korpora oft nicht durchführbar. Automatische Texterkennung (ATR) kann hierbei entscheidend helfen, Volltext aus gescannten Bildern zu extrahieren. Die entsprechende Software wie Transkribus, eScriptorium, OCR4all, OCR-D und andere entwickeln sich rasant und liefern mit ihren großen Modellen oft erstaunliche Ergebnisse.

Der Teaser zu den sechs Videos, v.l.n.r.: Pauline Spychala, David Lassner, Hippolyte Souvay, Hugo Scheithauer, Floriane Chiffoleau und Sarah Ondraszek.

Dennoch ist es nicht ganz einfach, wenn man vor der Herausforderung steht, automatische Texterkennung anwenden zu wollen, zumal wenn es sich um ein großes Korpus handelt.

[...]

Quelle: https://dhdhi.hypotheses.org/9053

Weiterlesen

Nächste Offene OCR-Sprechstunde am 14. März von 15 bis 16 Uhr

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 14. März 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20654

Weiterlesen

Erste OCR-Sprechstunde im neuen Jahr: 11. Januar zwischen 15 und 16 Uhr

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 11. Januar 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20440

Weiterlesen

Nächste offene OCR-Sprechstunde am 12. Oktober 2023 von 15 bis 16 Uhr

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 12. Oktober 2023 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20016

Weiterlesen

Nächste offene Sprechstunde des Kompetenzzentrums OCR am 13. Juli 2023

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 13. Juli 2023 statt.



[...]

Quelle: https://dhd-blog.org/?p=19576

Weiterlesen

Offene Sprechstunde des Kompetenzzentrums OCR am 15. Juni 2023

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Achtung: Aufgrund des Feiertags in Baden-Württemberg findet die Sprechstunde im Juni ausnahmsweise am dritten Donnerstag, dem 15. Juni statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=19465

Weiterlesen

Unbefristete RSE-Stelle am SCDH Münster (Schwerpunktbereich Texterkennung)

Die Universitäts- und Landesbibliothek (ULB) Münster ist die Zentralbibliothek der Westfälischen Wilhelms-Universität und gleichzeitig Landesbibliothek für den Landesteil Westfalen. Sie ist eine der größten wissenschaftlichen Bibliotheken Deutschlands. Die ULB Münster bietet ein umfangreiches Portfolio von wissenschaftsnahen Dienstleistungen für Forschende, Lehrende und Studierende an, dessen Weiterentwicklung im Rahmen der aktuellen digitalen Transformationsprozesse in der Wissenschaft von einer großen Entwicklungsdynamik geprägt ist.


Das an der ULB Münster angesiedelte Service Center for Digital Humanities (SCDH) unterstützt die Forschenden der WWU im Bereich Digital Humanities (DH) mit zahlreichen Services. Für das Akademieprojekt „Heinrich Scholz und die Schule von Münster: mathematische Logik und Grundlagenforschung“ ist zum nächstmöglichen Zeitpunkt die unbefristete Stelle als


Research Software Engineer

im Kontext Digital Humanities (wissenschaftliche/r Mitarbeiter/in, E13 TV-L)


mit 100 % der regelmäßigen wöchentlichen Arbeitszeit von zurzeit 39 Stunden 50 Minuten in der Woche zu besetzen.



[...]

Quelle: https://dhd-blog.org/?p=18680

Weiterlesen

Automatisierte Handschriftenerkennung: Das Projekt READ und die in seinem Rahmen entwickelte Plattform Transkribus

Menschen sind in der Lage, Handschriften zu entziffern. Wie sieht es bei den Maschinen aus? Können sie uns heutzutage diese Aufgabe komplett abnehmen oder ist es momentan noch nicht so weit? Über den Stand der Dinge zur automatisierten Handschriftenerkennung aus dem Kontext des Projekts READ berichtete im Rahmen des Kolloquiums Digital Humanities Tobias Hodel aus dem Staatsarchiv Zürich.

Handschriftenerkennung: Wozu der Aufwand?

Die Entzifferung von Archivdokumenten ermöglicht uns einen tiefen Einblick in die Vergangenheit. Millionen von Akten, die weltweit in unterschiedlichen Archiven in analoger oder digitaler Form aufbewahrt werden, verbergen unvorstellbare Mengen an Wissen und Erkenntnissen in sich.

Viele von diesen Dokumenten sind Handschriften.

[...]

Quelle: https://dhc.hypotheses.org/469

Weiterlesen