OCR – Seite 2 – Planet Clio

Allgemein, Digital Humanities, Forschung (Methode), Forschungsinfrastruktur, htr, OCR, Research Software Engineer, Stellenanzeigen, Stellenausschreibung, Texterkennung, Tool/Service

Unbefristete RSE-Stelle am SCDH Münster (Schwerpunktbereich Texterkennung)

25. November 2022 Keine Kommentare

Die Universitäts- und Landesbibliothek (ULB) Münster ist die Zentralbibliothek der Westfälischen Wilhelms-Universität und gleichzeitig Landesbibliothek für den Landesteil Westfalen. Sie ist eine der größten wissenschaftlichen Bibliotheken Deutschlands. Die ULB Münster bietet ein umfangreiches Portfolio von wissenschaftsnahen Dienstleistungen für Forschende, Lehrende und Studierende an, dessen Weiterentwicklung im Rahmen der aktuellen digitalen Transformationsprozesse in der Wissenschaft von einer großen Entwicklungsdynamik geprägt ist.

Das an der ULB Münster angesiedelte Service Center for Digital Humanities (SCDH) unterstützt die Forschenden der WWU im Bereich Digital Humanities (DH) mit zahlreichen Services. Für das Akademieprojekt „Heinrich Scholz und die Schule von Münster: mathematische Logik und Grundlagenforschung“ ist zum nächstmöglichen Zeitpunkt die unbefristete Stelle als

Research Software Engineer

im Kontext Digital Humanities (wissenschaftliche/r Mitarbeiter/in, E13 TV-L)

mit 100 % der regelmäßigen wöchentlichen Arbeitszeit von zurzeit 39 Stunden 50 Minuten in der Woche zu besetzen.

[...]

Quelle: https://dhd-blog.org/?p=18680

Digitale Lehre, Distant Reading, Historikertag, Historikertag 2021, NFDI4Memory, OCR, PDF, Praxislabor, Textextraktion, Workshop

[Praxislabor] Arbeiten mit (vielen) retrodigitialisierten Quellen: Texterkennung und Metadatenextraktion in PDF-Dateien mit freier Software

25. Februar 2021 Keine Kommentare

Moritz Mähr (wiss. Mitarbeiter an der Professur für Technikgeschichte, Zürich)

Lernen Sie in PDF-Dateien Texterkennung (OCR) und Textextraktion mit kostenlosen Befehlszeilenwerkzeugen wie Tesseract und Poppler durchzuführen und sich schnell einen Überblick über eine grosse Anzahl von PDF-Dokumenten zu verschaffen.

Zielpublikum

Wenn Sie eines oder mehrere der folgenden Kriterien erfüllen, wird diese Lektion für Sie lehrreich sein:

Sie arbeiten mit textbasierten Quellen und müssen den Inhalt der Quellen extrahieren.
Ihre Dateien liegen im PDF-Format vor oder können in dieses Dateiformat konvertiert werden.

Quelle: https://digigw.hypotheses.org/3683

Forschung, OCR

Neue DHd-AG OCR gegründet

25. September 2019 Keine Kommentare

Wir freuen uns sehr, die Gründung einer neuen DHd-AG namens „OCR“ bekannt geben zu dürfen.

Die neue DHd-AG OCR verfolgt im Wesentlichen folgende Ziele:

Vernetzung von Nutzer*innen, Vermittler*innen, Entwickler*innen und Forscher*innen durch mindestens jährliche Treffen sowie Workshops und gemeinsame Projekte mit dem Fokus auf freier und quelloffener Software bzw. Publikationen zum Thema.
Erarbeitung, Sicherung und Verbreitung von Best Practices zu praktischen Anwendungsfragen der OCR, z. B. Workflow, Formate, Parameter.

Quelle: https://dhd-blog.org/?p=12242

Allgemein, OCR, Stellenanzeigen, Wolfenbüttel

Stellenausschreibung: wiss. Mitarbeiter/in Koordination OCR-D, HAB Wolfenbüttel

9. April 2019 Keine Kommentare

An der Herzog August Bibliothek ist zum nächstmöglichen Zeitpunkt im Rahmen des von der DFG geförderten Projektes „Koordinierte Förderinitiative zur Weiterentwicklung von Verfahren für die Optical-Character-Recognition“ (OCR-D) die auf 12 Monate befristete Stelle einer/eines wissenschaftlichen Mitarbeiterin / Mitarbeiters (Entgeltgruppe 13 TV-L) zu besetzen.
Die Förderinitiative hat zum Ziel, einerseits Verfahren und Richtlinien für einen optimalen Workflow zu beschreiben sowie eine möglichst weitreichende Standardisierung von OCR-bezogenen Prozessen und Metadaten zu erarbeiten, andererseits die vollständige Transformation des schriftlichen deutschen Kulturerbes in eine maschinenlesbare Form (strukturierter Volltext) konzeptionell vorzubereiten (Masterplan). Das Vorhaben wird in Kooperation mit der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz, der Berlin-Brandenburgischen Akademie der Wissenschaften und dem Steinbuch Centre for Computing des Karlsruher Instituts für Technologie (KIT) durchgeführt.
In der abschließenden Projektphase steht insbesondere die Kommunikation mit den Kooperationspartnern, den Modulprojekten sowie externen Interessierten im Fokus.

Ihre Aufgaben:
• Projektmanagement und Projektkoordination mit besonderem Fokus auf den Schnittstellen zwischen den einzelnen Arbeitspaketen
• Kommunikation mit Experten und dem wissenschaftlichen Beirat
• Dokumentation der Projektergebnisse
• Vorbereitung und Durchführung von Workshops
• Mitarbeit an der Überarbeitung der DFG-Praxisregeln „Digitalisierung“
• Mitarbeit bei der Erarbeitung von Qualitätsstandards und Empfehlungen zur Nachnutzbarkeit

Sie bringen mit:
• Abgeschlossenes informationswissenschaftliches, geisteswissenschaftliches oder sozialwissenschaftliches Hochschulstudium
• Erfahrung in der Projektorganisation und ausgeprägte Kommunikationsfähigkeit
• Gute Kenntnisse zum Thema OCR und Digitalisierungsprozessen in Kultureinrichtungen
• Gute allgemeine informationsfachliche Kenntnisse
• Vertrautheit mit Drittmittelprojekten bzw. dem Antrags- und Berichtswesen der DFG
• Teamfähigkeit und soziale Kompetenz
• Sehr gute Englischkenntnisse
• Einsatzbereitschaft und Eigeninitiative

Von Vorteil sind:
• Kompetenzen in der Öffentlichkeitsarbeit, (Webauftritt u.a.

[...]

Quelle: https://dhd-blog.org/?p=11496

Artikel, htr, künstliche neuronale netze, layout analysis, Machine Learning, OCR, sviatoslav drach, veranstaltungspost

Automatisierte Handschriftenerkennung: Das Projekt READ und die in seinem Rahmen entwickelte Plattform Transkribus

26. September 2017 Keine Kommentare

Menschen sind in der Lage, Handschriften zu entziffern. Wie sieht es bei den Maschinen aus? Können sie uns heutzutage diese Aufgabe komplett abnehmen oder ist es momentan noch nicht so weit? Über den Stand der Dinge zur automatisierten Handschriftenerkennung aus dem Kontext des Projekts READ berichtete im Rahmen des Kolloquiums Digital Humanities Tobias Hodel aus dem Staatsarchiv Zürich.

Handschriftenerkennung: Wozu der Aufwand?

Die Entzifferung von Archivdokumenten ermöglicht uns einen tiefen Einblick in die Vergangenheit. Millionen von Akten, die weltweit in unterschiedlichen Archiven in analoger oder digitaler Form aufbewahrt werden, verbergen unvorstellbare Mengen an Wissen und Erkenntnissen in sich.

Viele von diesen Dokumenten sind Handschriften.

[...]

Quelle: https://dhc.hypotheses.org/469

Allgemein, community, Forschungsinfrastruktur, Kallimachos, Konferenz, OCR, Philtag, Tagung, Tagungsbericht, Veranstaltungen, Vortrag, Würzburg

Tagungsbericht zum <philtag n=″14″/>

25. April 2017 Keine Kommentare

Vom 16.-17. März 2017 fand in Würzburg der 14. Workshop der DH-Tagungsreihe <philtag/> statt. Die etablierte Würzburger Tagungsreihe zum Einsatz digitaler Methoden in den Geistes- und Kulturwissenschaften bietet den Teilnehmern die Möglichkeit, sich über neue Trends, Projekte und Technologien im Bereich der Digital Humanities zu informieren und auszutauschen. Wie schon im Vorjahr wurde der Workshop auch in diesem Jahr wieder von KALLIMACHOS, dem Zentrum für digitale Edition und quantitative Analyse der Universitätsbibliothek Würzburg, ausgerichtet. Den thematischen Schwerpunkt der diesjährigen Tagung stellten Digitale Editionen im erweiterten Sinne dar. Die insgesamt zwölf Vorträge beschäftigten sich mit Verfahren zur Erschließung digitaler Volltexte, insbesondere durch Optical Character Recognition (OCR), sowie mit der Korrektur, Auszeichnung und schließlich der Präsentation und Visualisierung der Texte und Textkorpora im Netz.

Tag 1
Den Anfang machten Wahed Hemati und Tolga Uslu (Universität Frankfurt), die zwei beim Frankfurter Text Technology Lab entwickelte Projekte vorstellten: Das Projekt Wikidition bietet eine Darstellungsumgebung für digitale Editionen, die auf Semantic MediaWiki basiert und unter Anderem Möglichkeiten zur Lemmatisierung, Annotation und Vergleich der erfassten Texte liefert.

[...]

Quelle: http://dhd-blog.org/?p=7903

Allgemein, community, Forschungsinfrastruktur, Kallimachos, OCR, Philtag, Tagungsbericht, text mining, Veranstaltungen, Würzburg

Tagungsbericht zum <philtag n=“13″/>

15. März 2016 Keine Kommentare

Am 25. und 26. Februar 2016 wurde unter der Leitung von KALLIMACHOS, dem Zentrum für digitale Edition und quantitative Analyse der Universitätsbibliothek Würzburg, der 13. Workshop der Reihe abgehalten. Die etablierte Würzburger Tagungsreihe zum Einsatz digitaler Methoden in den Geistes- und Kulturwissenschaften bietet den Teilnehmern die Möglichkeit, sich über neue Trends, Projekte und Technologien im Bereich der Digital Humanities zu informieren und auszutauschen.

Einen Themenschwerpunkt in diesem Jahr bildeten OCR-Verfahren, die am 1. Seminartag vorgestellt, diskutiert und praktisch erprobt wurden. Nach der Begrüßung und der Vorstellung des KALLIMACHOS-Projekts durch Dr. Hans-Günter Schmidt (UB Würzburg) folgte mit Dr.

[...]

Quelle: http://dhd-blog.org/?p=6501

community, Kallimachos, OCR, Philtag, text mining, Veranstaltungen, Würzburg

<PhilTag nr=“13″/>

10. Dezember 2015 Keine Kommentare

Am 25. und 26. Februar 2016 findet unter der Leitung von KALLIMACHOS, dem Zentrum für digitale Edition und quantitative Analyse der Universitätsbibliothek Würzburg, der 13. Workshop der Reihe <philtag/> statt. Die etablierte Würzburger Tagungsreihe zum Einsatz digitaler Methoden in den Geistes- und Kulturwissenschaften bietet den Teilnehmern die Möglichkeit, sich über neuen Trends, Projekte und Technologien im Bereich der Digital Humanities zu informieren und auszutauschen.

Einen Themenschwerpunkt in diesem Jahr bilden OCR-Verfahren, die vor allem am 1. Seminartag vorgestellt und von den Teilnehmern auch in der Praxis erprobt werden sollen. Der 2. Seminartag behandelt aktuelle Projekte der Digital Humanities mit besonderem Schwerpunkt auf Textmining-Verfahren.

[...]

Quelle: http://dhd-blog.org/?p=6047

ag digitale geisteswissenschaften, akten, Artikel, Bundesarchiv, dh-tools, dilemma, evernote, OCR, offene wissenschaft, onlinedienste je reproduktion, Storify, Tools, Twitter, verordnung über kosten beim bundesarchiv

Ein Problem der offenen Wissenschaft? – Das #Bundesarchiv

20. Juli 2015 Keine Kommentare

Twitter ist irgendwie das bessere Oberseminar :D.

— Charlotte Jahnz (@CJahnz) 7. Juli 2015

Daniel Meszner (@meszner) betreut gerade den Twitter-Account der AG Digitale Geisteswissenschaften des Verbands der Historiker und Historikerinnen Deutschlands (@digiw) und führt eine Twitter Umfrage über die “drei wichtigsten (digitalen) Tools für die Forschung” durch. Für mich hat sich neben Evernote (Über das Tobias Jakobi (@historytoby) einen schönen Beitrag geschrieben hat.) mittlerweile Twitter zu einem wirklich mächtigen Werkzeug entwickelt, dass ich anderen meist mit dem Leitfaden von Mareike König (@Mareike2405) näherbringe. Auf meine Masterarbeit und diesen Blog hat Twitter durchaus Einfluss, wie ich in diesem Beitrag aufzeigen möchte.

[...]

Quelle: http://winzen.hypotheses.org/351

Bibliothek, Digital Humanities, Digitalisierung, Kallimachos, OCR, Stellenanzeigen

Mitarbeiter/in in den Digital Humanities, Digitalisierungszentrum der Universität Würzburg

12. Juni 2015 Keine Kommentare

Am Digitalisierungszentrum der Universität Würzburg (Universitätsbibliothek) ist ab sofort in Vollzeit die Stelle eines/einer

Mitarbeiters/Mitarbeiterin in den Digital Humanities

zu besetzen. Die Stelle ist teilzeitfähig, sofern durch Jobsharing die ganztägige Wahrnehmung der Aufgaben gesichert ist. Die Vergütung richtet sich nach dem TV-L.

Die Stelle ist bis zum 30.9.2017 befristet und wird im Rahmen des BMBF-Projektes „Kallimachos“ ausgeschrieben, das den Aufbau eines Digital-Humanities-Zentrums mit den Schwerpunkten digitale Edition und quantitative Analyseverfahren (Textmining) an der Universität Würzburg zum Ziel hat. Sie soll insbesondere der Unterstützung der Projektleitung bei Koordination, Dokumentation und Dissemination der Projektergebnisse dienen sowie die anwenderbezogene Entwicklung von Tools zur Unterstützung digitaler Editionen begleiten.

[...]

Quelle: http://dhd-blog.org/?p=5217