Korpusbildung-Workshop der AG Zeitungen und Zeitschriften

Die DHd-AG Zeitungen & Zeitschriften (https://dhd-ag-zz.github.io/) bietet am 11. und 12. November 2021 jeweils von 9:00-13:00 Uhr einen virtuellen Workshop an, um anhand digitaler Zeitungs- und Zeitschriftenbestände zu zeigen, wie die für viele Forschende notwendige, individuelle Korpusbildung in Zeitungsportalen selbst sowie mittels NLP-Methoden unterstützt werden kann. 

Geisteswissenschaftliche Forschung basiert häufig auf themenspezifischen Forschungsfragen, weshalb die Korpusbildung einen wesentlichen Aspekt in der Arbeit mit digitalen Quellen einnimmt. Solche Korpora müssen jedoch nicht selten in zeitaufwändigen und komplexen Prozessen erstellt werden, weil Suchstrategien nicht ausreichen oder weil fehlende Layout- Segmentierung den Zugriff erschwert. Insbesondere bei retro-digitalisierten Zeitungen hängt die Korpusbildung stark von der Qualität der Digitalisate (OCR und Artikelsegmentierung) ab. 



[...]

Quelle: https://dhd-blog.org/?p=16557

Weiterlesen

DHd-AG Zeitungen & Zeitschriften bietet Workshop zu Metadaten-Analyse an

Die DHd-AG Zeitungen & Zeitschriften bietet am 3. und 4. September 2020 jeweils von 9-16 Uhr einen virtuellen Workshop an, um anhand komplexer Beispiele der Medien Zeitungen und Zeitschriften zu zeigen, wie man an die Metadaten heran kommt, wie man sie danach weiter vorbereitet, um dann spezifische Forschungsfragen damit zu beantworten. Das Angebot digitaler Ressourcen zu Zeitungen und Zeitschriften beginnt beim Eintrag der bibliografischen Metadaten in Kataloge und Verzeichnisse und führt über die Metadaten aus dem Digitalisierungsprozess (Bild-Digitalisierung) bis hin zu den Metadaten des Volltexts (sollte dieser vorhanden sein). Teilnehmerinnen und Teilnehmer werden daher eingeladen, eine konkrete Forschungsfrage mitzubringen. Beispieldatensätze (aus Europeana Newspaper oder anderen Portalen wie der Deutschen Digitalen Bibliothek) werden bereit gestellt.

In drei Schritten nähern wir uns dabei der Analyse der Metadaten und damit auch der Beantwortung individueller Forschungsfragen:

  • Wie komme ich an die Metadaten? Schnittstellen und Metadaten-Standards, Grundlagen und Praxis


  • [...]

Quelle: https://dhd-blog.org/?p=14076

Weiterlesen

Virtuelles Semester und digitale Forschungsinfrastrukturen

Nachdem das Sommersemester deutschlandweit virtuell gestartet ist, werden auch Fragen der Kompetenzen im Umgang mit digitalen (Forschungs-)Infrastrukturen, aber auch allgemein der Wunsch nach Förderung der data literacy auf allen Ebenen von Lehren, Lernen und Forschen dringlicher.

Fast schon vorauseilend wurde das Thema auch auf der jüngsten DHd-Jahrestagung in einem Workshop der AG Datenzentren behandelt.

Die DH-Community ist zwar im Umgang mit digitalen Ressourcen und Methoden in der täglichen Lehr- und Forschungspraxis vertraut, doch auch hier waren sowohl Lehre als auch Forschungsveranstaltungen auf Präsenz ausgerichtet. Wir sitzen insofern mit allen ‚Präsenzlehrenden‘ in einem Boot wie wir keine speziellen Kompetenzen des E-Learning unter dem Dach der digitalen Forschungsinfrastrukturen für die Geisteswissenschaften versammelt haben.

Dennoch engagieren sich CLARIAH, CLARIN und DARIAH sowohl auf europäischer als auch auf nationaler Ebene schon seit einiger Zeit, um digitale Lehrangebote zu teilen und möglichst breit zur Verfügung zu stellen. Der aktuelle Bedarf, hat dazu bewogen, die Schulungsmaterialien von DARIAH-DE neu zu strukturieren und eine Best-of-Übersicht zusammenzustellen. Diese ist sicher erweiterbar und kann einzelphilologische Angebote, wie z.

[...]

Quelle: https://dhd-blog.org/?p=13583

Weiterlesen

DH- Workshops in Tübingen: Publishing Data und Topic Modeling

Am 8. und 9. Februar veranstaltet der Lehrstuhl für Romanische Philologie der Universität Tübingen zwei Workshops zum Thema „Publishing Data using GitHub“ von José Calvo Tello und „Einführung in Topic Modeling“ von Ulrike Henny-Krahmer (beide Universität Würzburg).

Die Teilnehmeranzahl ist beschränkt, um Anmeldung wird bis zum 1. Februar gebeten, per mail an Frau Ehrt: monika.ehrt@uni-tuebingen.de

„Publishing Data using GitHub“ (8.

[...]

Quelle: http://dhd-blog.org/?p=8936

Weiterlesen