htr – Planet Clio

ATR, Automatische Texterkennung, htr, Projekte des DHIP

Wie man Volltext aus gescannten handschriftlichen Quellen extrahiert: Video-Tutorials über Automatische Texterkennung jetzt online

21. Juni 2024 Keine Kommentare

Die manuelle Transkription handschriftlicher oder gedruckter Quellen ist häufig zeitaufwändig und bei größeren Korpora oft nicht durchführbar. Automatische Texterkennung (ATR) kann hierbei entscheidend helfen, Volltext aus gescannten Bildern zu extrahieren. Die entsprechende Software wie Transkribus, eScriptorium, OCR4all, OCR-D und andere entwickeln sich rasant und liefern mit ihren großen Modellen oft erstaunliche Ergebnisse.

Der Teaser zu den sechs Videos, v.l.n.r.: Pauline Spychala, David Lassner, Hippolyte Souvay, Hugo Scheithauer, Floriane Chiffoleau und Sarah Ondraszek.

Dennoch ist es nicht ganz einfach, wenn man vor der Herausforderung steht, automatische Texterkennung anwenden zu wollen, zumal wenn es sich um ein großes Korpus handelt.

[...]

Quelle: https://dhdhi.hypotheses.org/9053

community, eScriptorium, Forschungsdaten, Forschungsinfrastruktur, htr, OCR, Texterkennung, Tool/Service, Transkribus

Nächste Offene OCR-Sprechstunde am 14. März von 15 bis 16 Uhr

5. März 2024 Keine Kommentare

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 14. März 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20654

ATR, eScriptorium, Forschungsdaten, Forschungsinfrastruktur, fraktur, Handschrift, htr, OCR, Sprechstunde, Tool/Service, Transkribus

Erste OCR-Sprechstunde im neuen Jahr: 11. Januar zwischen 15 und 16 Uhr

4. Januar 2024 Keine Kommentare

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 11. Januar 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20440

ATR, eScriptorium, Forschungsdaten, Forschungsinfrastruktur, htr, Mannheim, OCR, OCR-BW, Tesseract, Texterkennung, Tool/Service, Transkribus, tübingen

Nächste offene OCR-Sprechstunde am 12. Oktober 2023 von 15 bis 16 Uhr

10. Oktober 2023 Keine Kommentare

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 12. Oktober 2023 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=20016

eScriptorium, Forschungsdaten, Forschungsinfrastruktur, htr, Mannheim, OCR, Sprechstunde, Tesseract, Tool/Service, Transkribus, transkription, tübingen, Volltext

Nächste offene Sprechstunde des Kompetenzzentrums OCR am 13. Juli 2023

30. Juni 2023 Keine Kommentare

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 13. Juli 2023 statt.

[...]

Quelle: https://dhd-blog.org/?p=19576

eScriptorium, Forschungsdaten, Forschungsinfrastruktur, htr, Mannheim, OCR, Sprechstunde, Tesseract, Texterkennung, Tool/Service, Transkribus, transkription, tübingen

Offene Sprechstunde des Kompetenzzentrums OCR am 15. Juni 2023

1. Juni 2023 Keine Kommentare

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Achtung: Aufgrund des Feiertags in Baden-Württemberg findet die Sprechstunde im Juni ausnahmsweise am dritten Donnerstag, dem 15. Juni statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.

[...]

Quelle: https://dhd-blog.org/?p=19465

ATR, eScriptorium, htr, OCR, Transkribus, Veranstaltungen

Jetzt bewerben: Von der historischen Quelle zum Volltext: Praxis-Workshop zur Anwendung automatisierter Schrifterkennung (ATR), 7.-8.9.2023

12. Mai 2023 Keine Kommentare

Datum: 7.-8. September 2023, (Beginn 14h00 am 7.9., Ende 17h00 am 8.9.2023)

Ort: DHI Paris

Einreichungsfrist: 26. Juni 2023 (CV und Motivationsschreiben in einer PDF-Datei)

[...]

Quelle: https://dhdhi.hypotheses.org/8484

ATR, eScriptorium, htr, OCR, Transkribus, Veranstaltungen

Jetzt bewerben: Von der historischen Quelle zum Volltext: Praxis-Workshop zur Anwendung automatisierter Schrifterkennung (ATR), 7.-8.9.2023

12. Mai 2023 Keine Kommentare

Datum: 7.-8. September 2023, (Beginn 14h00 am 7.9., Ende 17h00 am 8.9.2023)

Ort: DHI Paris

Einreichungsfrist: 26. Juni 2023 (CV und Motivationsschreiben in einer PDF-Datei)

[...]

Quelle: https://dhdhi.hypotheses.org/8484

Allgemein, Digital Humanities, Forschung (Methode), Forschungsinfrastruktur, htr, OCR, Research Software Engineer, Stellenanzeigen, Stellenausschreibung, Texterkennung, Tool/Service

Unbefristete RSE-Stelle am SCDH Münster (Schwerpunktbereich Texterkennung)

25. November 2022 Keine Kommentare

Die Universitäts- und Landesbibliothek (ULB) Münster ist die Zentralbibliothek der Westfälischen Wilhelms-Universität und gleichzeitig Landesbibliothek für den Landesteil Westfalen. Sie ist eine der größten wissenschaftlichen Bibliotheken Deutschlands. Die ULB Münster bietet ein umfangreiches Portfolio von wissenschaftsnahen Dienstleistungen für Forschende, Lehrende und Studierende an, dessen Weiterentwicklung im Rahmen der aktuellen digitalen Transformationsprozesse in der Wissenschaft von einer großen Entwicklungsdynamik geprägt ist.

Das an der ULB Münster angesiedelte Service Center for Digital Humanities (SCDH) unterstützt die Forschenden der WWU im Bereich Digital Humanities (DH) mit zahlreichen Services. Für das Akademieprojekt „Heinrich Scholz und die Schule von Münster: mathematische Logik und Grundlagenforschung“ ist zum nächstmöglichen Zeitpunkt die unbefristete Stelle als

Research Software Engineer

im Kontext Digital Humanities (wissenschaftliche/r Mitarbeiter/in, E13 TV-L)

mit 100 % der regelmäßigen wöchentlichen Arbeitszeit von zurzeit 39 Stunden 50 Minuten in der Woche zu besetzen.

[...]

Quelle: https://dhd-blog.org/?p=18680

Artikel, htr, künstliche neuronale netze, layout analysis, Machine Learning, OCR, sviatoslav drach, veranstaltungspost

Automatisierte Handschriftenerkennung: Das Projekt READ und die in seinem Rahmen entwickelte Plattform Transkribus

26. September 2017 Keine Kommentare

Menschen sind in der Lage, Handschriften zu entziffern. Wie sieht es bei den Maschinen aus? Können sie uns heutzutage diese Aufgabe komplett abnehmen oder ist es momentan noch nicht so weit? Über den Stand der Dinge zur automatisierten Handschriftenerkennung aus dem Kontext des Projekts READ berichtete im Rahmen des Kolloquiums Digital Humanities Tobias Hodel aus dem Staatsarchiv Zürich.

Handschriftenerkennung: Wozu der Aufwand?

Die Entzifferung von Archivdokumenten ermöglicht uns einen tiefen Einblick in die Vergangenheit. Millionen von Akten, die weltweit in unterschiedlichen Archiven in analoger oder digitaler Form aufbewahrt werden, verbergen unvorstellbare Mengen an Wissen und Erkenntnissen in sich.

Viele von diesen Dokumenten sind Handschriften.

[...]

Quelle: https://dhc.hypotheses.org/469