Die Einbindung externer Werkzeuge in das TextGrid Repository

Das TextGrid Repository

Das TextGrid Repository (TextGridRep) ist ein nachhaltiges, dauerhaftes und sicheres Digitalarchiv für geisteswissenschaftliche Forschungsdaten. Es basiert auf Open Access und orientiert sich an den FAIR-Datenprinzipien, wofür es 2020 mit dem CoreTrustSeal zertifiziert wurde. Für Forschende ist das TextGridRep sehr wertvoll, da es zitierfähige und mit Metadaten angereicherte Daten zur Verfügung stellt. Die Daten bestehen zum Großteil aus Texten, die in XML/TEI kodiert sind, aber auch aus Bildern. Der Datenbestand des TextGridRep wächst stetig weiter, da es offen für projektspezifische, wissenschaftliche Editionen sowie Forschungsdaten im Allgemeinen und dabei frei von sprachlichen Beschränkungen ist. Zur Bearbeitung und Analyse der Daten sind im TextGridRep einige Werkzeuge eingebunden.

Warum braucht es externe Werkzeuge?

Einer schnellen, unkomplizierten Annotation und computergestützten Analyse von Forschungsdaten sind Anwender*innen häufig einige Grenzen gesetzt: Zur Bearbeitung ist es oft nötig, mehrere einzelne, auf einen spezifischen Task ausgerichtete Werkzeuge herunterzuladen und diese technisch auf dem eigenen Rechner einzurichten. Da aber teilweise ortsflexibel und in größeren Teams gearbeitet wird, sind die Installationsschritte häufig mehrfach nötig.

[...]

Quelle: https://dhd-blog.org/?p=14999

Weiterlesen

BMBF geförderte Nachwuchsgruppe “eTRAP – electronic Text Re-use Acuisition Project”

gcdh_logo_highresWir freuen uns, die durch das Bundesministerium für Bildung und Foschung (BMBF) finanzierte und am Göttingen Centre for Digital Humanities (GCDH) angesiedelte Nachwuchsgruppe eTRAP (electronic Text Reuse Acquisition Project) bekannt machen zu dürfen.

eTRAP ist eine international und interdisziplinär zusammengestellte Forschergruppe, die ab 1. März 2015 für vier Jahre vor dem Hintergrund der Klassischen Philologie, Geschichte, den Digital Humanities, der Natürlichen Sprachverarbeitung sowie der Visualisierung und der Paläografie/Kodikologie (Handschriftenkunde) an der Georg-August-Universität Göttingen forschen und lehren wird.

Im Fokus der Arbeiten steht dabei das Interesse daran, wie Paraphrasen, Allusionen oder auch Übersetzungen (im Generellen Re-Use) von historischen Autoren in ihren Arbeiten weitergegeben wurden, warum Re-use weiter gegeben wurde und welche Intensionen und Einflüsse dabei eine Rolle gespielt haben. Die Nachwuchsgruppe möchte damit eine Methodik schaffen, mit der „Historischer Text Re-use“ trotz seiner starken Diversität (aufgrund langer Überlieferungslinien, sprachlicher und kultureller Einflüsse, Zerstörung) beschrieben und messbar gemacht werden kann. So werden beispielsweise viele statistische Maße unbrauchbar, wenn historische Texte einen signifikanten Anteil von Re-use enthalten. Diesen  gründlich zu erfassen, ist jedoch auf variantem, historischem Text noch keineswegs gelöst. Als Untersuchungsgrundlage werden Big Data hinzugezogen, also Daten, die zu umfangreich sind, um sie manuell bearbeiten zu können. Es werden Texte in den Sprachen Altgriechisch, Deutsch, Englisch, Italienisch und Latein bearbeitet.

Weitere Informationen zum Projekt und zur Nachwuchsgruppe finden Sie unter http://etrap.gcdh.de/

Quelle: http://dhd-blog.org/?p=4853

Weiterlesen

2013 DARIAH Sommerschule ein Großer Erfolg

Die 2013 DARIAH-DE International Digital Humanities Summer School, die vom 19. bis 23. August am Göttingen Centre for Digital Humanities stattfand, war ein voller Erfolg. Die Sommerschule, die sich auf die Verarbeitung natürlicher Sprache mit der Programmiersprache Python konzentrierte, wurde von Mike Kestemont von der Universität Antwerpen in Belgien und Lars Wieneke vom CVCE in Luxemburg geleitet. Die Schule brachte 20 Teilnehmer aus 10 verschiedenen Ländern, von denen die meisten noch nie eine Zeile Programmcode geschrieben hatten, zusammen und förderte sie soweit, dass sie in Teamarbeit Antworten auf komplexe Fragestellungen erarbeiten konnten. Aufgrund der großzügigen Unterstützung durch DARIAH-DE konnten wir Mike und Lars für eine Woche nach Göttingen holen und die Übernachtungen der studentischen Teilnehmer voll fördern. Dies hat es uns ermöglicht, eine neue Generation von Wissenschaftlern zu erreichen, die ohne diese Unterstützung nicht in der Lage gewesen wäre, die Sommerschule zu besuchen.
Zwei Hauptgründe für den Erfolg unserer Sommerschule waren zum einen die fantastischen Lehrer und zum anderen die hochmotivierten Teilnehmer. Mike und Lars konnten ihre Begeisterung für die Möglichkeiten von Python so gut an die Teilnehmer vermitteln, dass sie intensiv mitarbeiteten und oft Kaffee- und Mittagspausen nutzten, um Probleme zu diskutieren und gemeinsam zu lösen. In der Tat war die häufigste Kritik der Teilnehmer, dass die Sommerschule zu kurz gewesen sei. Sie hätten gerne noch eine Woche rangehängt, um die Informationen weiter zu verarbeiten und mehr über die Bearbeitung von Texten mit Python zu lernen.
Unsere Erfahrungen mit der Sommerschule zeigen, dass es eine Reihe von Wissenschaftlern gibt, die mehr als nur Mark-up und Text Encoding lernen wollen. Sie möchten Methoden der Datenmanipulation erlernen, Datenanalyse betreiben, und die Freiheit und Flexibilität einer Programmiersprache voll nutzen statt durch vorgefertigte Suites von Tools sowie AntConc oder IBM LanguageWare eingeschränkt zu sein. Die Göttinger Sommerschule hat darüberhinaus die Effektivität dieses intensiven Schulungsformats gezeigt, das Wissenschaftlern die benötigten Kenntnisse für das Einsetzen digitaler Methoden in ihrer Forschung erfolgreich vermittelt.

Quelle: http://dhd-blog.org/?p=2212

Weiterlesen

2013 DARIAH-DE International DH Summer School

Vom 19. bis zum 25. August 2013 findet die erste internationale DARIAH-DE DH Summer School in Göttingen, Deutschland, statt. Die einwöchige Veranstaltung wird vom Göttingen Centre for Digital Humanities angeboten; Hauptthema wird die digitale Textanalyse mit der Programmiersprache Python sein. Der Hauptseminarleiter wird Mike Kestemont von der Universität Antwerpen sein. Eine kurze englische Zusammenfassung der Veranstaltungsinhalte befindet sich hier: Mike Kestemont – Plan for 2013 Summer School.
Die Sommerschule richtet sich primär an Doktoranden und Post-Doktoranden. Aber auch andere Interessierte mit fortgeschrittenen Kenntnissen der geisteswissenschaftlichen Forschung sind herzlich willkommen. Die Veranstaltungssprache ist Englisch.

Quelle: http://dhd-blog.org/?p=1543

Weiterlesen