Virtuelles DH-Kolloquium an der BBAW, 02.12.2024: „Transformative Prozesse in der Lexikologie und Lexikografie des Mandschurischen: Von historischen Wörterbüchern zur digitalen Erschließung“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 2. Dezember 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Oliver Corff
über
Transformative Prozesse in der Lexikologie und Lexikografie des Mandschurischen: Von historischen Wörterbüchern zur digitalen Erschließung

***

Das Volk der Manjuren eroberte im Jahre 1644 die chinesische Hauptstadt Peking, was das offizielle Gründungsdatum der Qing-Dynastie, der letzten großen Fremdherrschaft auf chinesischem Boden, ist. Die Manjuren kultivierten und formalisierten zumindest in der ersten Hälfte der Qing-Dynastie ihre Sprache.

[...]

Quelle: https://dhd-blog.org/?p=21785

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 28.10.2024: „fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 28. Oktober 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Timm Lehmberg (Akademie der Wissenschaften in Hamburg)
über
fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH

***

Der Beitrag führt in die Methoden der Retrieval Augmented Generation (RAG) ein, einem mittlerweile auch in den Digital Humanities verbreiteten Verfahren, das es ermöglicht, auf eigene Datenquellen mithilfe großer Sprachmodelle (Large Language Models, LLMs)  zuzugreifen. Ziel der Mehrzahl der Anwendungsfälle ist dabei zumeist, fachspezifische Abfragen und Analysen (nicht selten unter Verwendung eingeschränkt zugänglicher lokaler Datenbestände) per Chat Prompting durchzuführen.

[...]

Quelle: https://dhd-blog.org/?p=21698

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 30.09.2024: „Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. September 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christian Reul (Universität Würzburg)
über
Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz

***

Ein zentraler Aspekt der Arbeit von geistes- und kulturwissenschaftlich Forschenden ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen häufig lediglich als Scans vor, aus denen zunächst maschinenverarbeitbarer Volltext extrahiert werden muss, wozu Methoden der automatischen Texterkennung zum Einsatz kommen.

[...]

Quelle: https://dhd-blog.org/?p=21575

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 30.09.2024: „Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz“

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. September 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christian Reul (Universität Würzburg)
über
Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz

***

Ein zentraler Aspekt der Arbeit von geistes- und kulturwissenschaftlich Forschenden ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen häufig lediglich als Scans vor, aus denen zunächst maschinenverarbeitbarer Volltext extrahiert werden muss, wozu Methoden der automatischen Texterkennung zum Einsatz kommen.

[...]

Quelle: https://dhd-blog.org/?p=21575

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 27.05.2024: Herausforderung Instagram: multimodal-ephemere Daten (unter)suchen

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. Mai 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Konstanze Marx (Universität Greifswald)
über
Herausforderung Instagram: multimodal-ephemere Daten (unter)suchen

***

Als eine der beliebtesten Social-Media-Plattformen rückt Instagram immer mehr in den Fokus von Sprachwissenschaftler:innen. Bislang gibt es jedoch noch keine Standards für Korpora, die multimodale und ephemere Daten enthalten, wie sie für Instagram typisch sind.

[...]

Quelle: https://dhd-blog.org/?p=20952

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 26.02.2024: Korpora für die Lexikographie. Welche Rolle spielen literarische Texte?

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 26. Februar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Lothar Lemnitzer (Berlin-Brandenburgische Akademie der Wissenschaften) und
Thomas Gloning (Justus-Liebig-Universität Gießen und BBAW)
über
Korpora für die Lexikographie. Welche Rolle spielen literarische Texte?

***



[...]

Quelle: https://dhd-blog.org/?p=20586

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 29.01.2024: Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 29. Januar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Noah Bubenhofer (Universität Zürich)
über
Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

***

Seit der Lancierung von ChatGPT befasst sich die breite Öffentlichkeit mit sog. Large Language Models (Sprachmodellen) und streitet über die Chancen und Gefahren dieser Technologie.

[...]

Quelle: https://dhd-blog.org/?p=20494

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 11.12.2023: Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 11. Dezember 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Roman Schneider (Leibniz-Institut für Deutsche Sprache, Mannheim)
Adrien Barbaresi (Berlin-Brandenburgische Akademie der Wissenschaften)

Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie

***

Roman Schneider (IDS Mannheim): Songtexte als lexikografische Datenbasis

Mit dem Songkorpus (Schneider 2022) liegt erstmalig eine nachhaltig nutzbare wissenschaftliche Ressource für empirische Songtextanalysen vor.

[...]

Quelle: https://dhd-blog.org/?p=20327

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 27.11.2023: Neues aus dem Maschinenraum der Korpus-Annotation

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. November 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Nils Diewald und Marc Kupietz (Leibniz-Institut für Deutsche Sprache, Mannheim)
Gregor Middell und Andreas Nolda (Berlin-Brandenburgische Akademie der Wissenschaften)

Neues aus dem Maschinenraum der Korpus-Annotation

Gegenstand dieses Kolloquiums sind neue Entwicklungen aus dem Maschinenraum der Korpus-Annotation am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim sowie am Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) an der BBAW. Dabei werden zunächst zwei Tools vorgestellt, die an jeweils einer der beiden Institutionen entwickelt werden und an der anderen Institution nachgenutzt werden sollen: der KorAP-Tokenizer von Marc Kupietz und Nils Diewald und das morphologische Analysetool DWDSmor von Andreas Nolda.

[...]

Quelle: https://dhd-blog.org/?p=20297

Weiterlesen

Virtuelles DH-Kolloquium an der BBAW, 13.11.2023: Historische Textkorpora für die Lexikographie

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 13. November 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Matthias Boenig, Susanne Haaf, Marius Hug
(alle Berlin-Brandenburgische Akademie der Wissenschaften)
Nico Dorn, Volker Harm, Nathalie Mederake, Kerstin Meyer-Hinrichs
(alle Akademie der Wissenschaften zu Göttingen)

Historische Textkorpora für die Lexikographie

In diesem Kolloquium betrachten wir das Zusammenspiel aus der Bereitstellung historischer Textkorpora des Deutschen als Forschungsdaten und der Nutzung dieser Korpora für die historisch-lexikographische Arbeit.



[...]

Quelle: https://dhd-blog.org/?p=20142

Weiterlesen