Die DHd-AG Zeitungen & Zeitschriften (https://dhd-ag-zz.github.io/
) bietet am 11. und 12. November 2021 jeweils von 9:00-13:00 Uhr einen virtuellen Workshop an, um anhand digitaler Zeitungs- und Zeitschriftenbestände zu zeigen, wie die für viele Forschende notwendige, individuelle Korpusbildung in Zeitungsportalen selbst sowie mittels NLP-Methoden unterstützt werden kann.
Geisteswissenschaftliche Forschung basiert häufig auf themenspezifischen Forschungsfragen, weshalb die Korpusbildung einen wesentlichen Aspekt in der Arbeit mit digitalen Quellen einnimmt. Solche Korpora müssen jedoch nicht selten in zeitaufwändigen und komplexen Prozessen erstellt werden, weil Suchstrategien nicht ausreichen oder weil fehlende Layout- Segmentierung den Zugriff erschwert. Insbesondere bei retro-digitalisierten Zeitungen hängt die Korpusbildung stark von der Qualität der Digitalisate (OCR und Artikelsegmentierung) ab.
[...]
Quelle: https://dhd-blog.org/?p=16557