Der Weg zu den Forschungsdaten. Ein Beispielguide für die Nutzung der REST-Schnittstelle der Regesta Imperii mithilfe von Python

Inhalt

Einführung
Die Daten im XML-Format
Aufbau der REST-Schnittstelle
Voraussetzungen für die Benutzung
Beschreibung der Benutzung der Skripte
Beschreibung der Funktionsweise der Skripte
Skripte

 

Einführung

Die sich inzwischen auch in den Geistes- und Kulturwissenschaften verbreitende freie Lizenzierung von Forschungsdaten eröffnet der Wissenschaft theoretisch die Möglichkeit der Nachnutzung derselben für andere Projekte. Praktisch steht der einzelne Forscher oftmals vor der Hürde, überhaupt an die Daten zu kommen, da oft einfache Zugangswege zu den Daten in geeigneten Formaten fehlen und so Anfragen an die datenhaltende Institution nötig sind, die eine mehr oder minder schwere Zugangsschranke darstellen können und so den Sinn der freien Lizenzierung konterkarieren. Im Folgenden soll am Beispiel des Akademieprojekts Regesta Imperii (Quellen zur Reichsgeschichte) ein Weg aufgezeigt werden diese Hürde zu überwinden.

Ziel des Projekts ist es, sämtliche urkundlich und historiographisch belegten Aktivitäten der römisch-deutschen Könige und Kaiser von den Karolingern bis zu Maximilian I. (ca. 751–1519) sowie der Päpste des frühen und hohen Mittelalters in Form deutschsprachiger Regesten, also einer standardisierten wissenschaftlichen Aufarbeitung, zu verzeichnen. In dieser Unternehmung, angesiedelt insbesondere an der Mainzer Akademie der Wissenschaften sowie an der Berlin-Brandenburgischen Akademie und der Österreichischen Akademie, sind bisher über 90 gedruckte Bände erschienen sowie 135.

[...]

Quelle: http://mittelalter.hypotheses.org/11794

Weiterlesen

DARIAH-DE – Forschen mit digitalen Diensten und Werkzeugen für alle Geistes- und Kulturwissenschaftler

Einstieg

Im Zuge der Digitalisierung von Wirtschaft, Gesellschaft und Wissenschaft gewinnen auch die Digital Humanities zunehmend an Bedeutung. Die stark anwachsende Verfügbarkeit digitaler Daten für die Forschung trägt dazu bei, das Interesse an den Methoden und Werkzeugen dieser vergleichsweise jungen Disziplin zu wecken.

EinsteigerInnen in die Digital Humanities stellen sich häufig die Fragen: Was sind die Digital Humanities, welche Forschungsfragen lassen sich mit den Mitteln der Digital Humanities bearbeiten, welche Werkzeuge sind für bestimmte Fragestellungen in unterschiedlichen Fachdisziplinen geeignet, wie ist mit digitalen Forschungsdaten zu verfahren im Hinblick auf Ihre Aufbereitung, Speicherung, Veröffentlichung, Zitierbarkeit und Nachnutzbarkeit?

Die digitalen Geisteswissenschaften lassen sich an der Schnittstelle zwischen Informatik und Geisteswissenschaften verorten. Das Selbstverständnis kann dabei zwischen den beiden Endpolen variieren und entsprechend aufgefasst werden – als unterstützendes Angebot und Erweiterung oder als eigenständige Disziplin mit einem ganz eigenen theoretischen und methodischen Ansatz. Auch die fachliche Zuordnung erweist sich als variabel. So gibt es Universitäten, in denen die Digital Humanities der Informatik und solche, wo sie den geisteswissenschaftlichen Fächern zugeordnet sind. Sieht man von der noch nicht abgeschlossenen Definitionsdebatte ab, so können die Digital Humanities in einer Minimalbeschreibung als Sammelbezeichnung für computergestützte Verfahren und Methoden aufgefasst werden, die im Zuge der digitalen Transformation der Geistes- und Kulturwissenschaften Einzug in die wissenschaftliche Praxis halten.

[...]

Quelle: http://dhd-blog.org/?p=9082

Weiterlesen

CfP: Forschungsdaten in der Geschichtswissenschaft

Die Projektförderung durch Drittmittelgeber ist oft mit der Maßgabe verbunden, die gewonnenen Forschungsdaten öffentlich zugänglich zu machen. Für HistorikerInnen stellt sich dabei die keinesfalls triviale Frage: Was ist im Rahmen der Geschichtswissenschaften überhaupt unter Forschungsdaten zu verstehen?

Die geplante Tagung möchte diese Frage aufgreifen und in einem breiteren Rahmen diskutieren. In mehreren Sektionen soll dabei diskutiert werden, 1) was geschichtswissenschaftliche Forschungsdaten sind, 2) wie diese gespeichert, organisiert und nutzbar gemacht werden können, 3) wie wir hierfür gemeinsame Standards entwickeln können und 4) welche Rolle in diesem Rahmen der Datenautorschaft zukommt.

1) Forschungsdaten in der Geschichtswissenschaft

Das Stichwort ‚Data Deluge‘ beschreibt die Flut von potentiell relevanten und frei verfügbaren Daten, der wir uns gegenüber sehen – auch als HistorikerInnen. Dies betrifft zum einen generisch digitale Daten aus Verwaltung, sozialen Medien und verschiedenen Formen der digitalen Kommunikation. Man denke hier nur an die SMS der Bundeskanzlerin oder die aktuellen Debatten um die zersplitterten Diskursräume in den sozialen Medien.

[...]

Quelle: http://digigw.hypotheses.org/1733

Weiterlesen

DH- Workshops in Tübingen: Publishing Data und Topic Modeling

Am 8. und 9. Februar veranstaltet der Lehrstuhl für Romanische Philologie der Universität Tübingen zwei Workshops zum Thema „Publishing Data using GitHub“ von José Calvo Tello und „Einführung in Topic Modeling“ von Ulrike Henny-Krahmer (beide Universität Würzburg).

Die Teilnehmeranzahl ist beschränkt, um Anmeldung wird bis zum 1. Februar gebeten, per mail an Frau Ehrt: monika.ehrt@uni-tuebingen.de

„Publishing Data using GitHub“ (8.

[...]

Quelle: http://dhd-blog.org/?p=8936

Weiterlesen

CLARIN – die kompetenzorientierte Lösung in der Datenvernetzung

Zugang zu linguistischen Sprachressourcen mit nur einem Login. Ein großes Versprechen. Dahinter steckt das Projekt, welches Prof. Dr. Andreas Witt in dem Vortrag vom 20. Juli 2017 vorstellte. CLARIN[1] steht für „Common Language Resources and Technology Infrastructure“ und der Name ist Programm. Das Konzept: an verschiedenen Standorten werden Ressourcen zur Verfügung gestellt, die Computerlinguisten, weitere Geisteswissenschaftler und weitere Interessierte nutzen können. Das Ziel ist die Schaffung einer gemeinsamen Infrastruktur, die den Zugang herstellt, unabhängig von Institutionen, Nationen oder Disziplinen. Deshalb ist auch die Zielgruppe nicht bloß auf Computerlinguisten beschränkt.

[...]

Quelle: https://dhc.hypotheses.org/491

Weiterlesen

Meine erste Kollektion im DARIAH-DE Ropository

Da die geistes- und kulturwissenschaftliche Community endlich ein eigenes fachwissenschaftliches Repositorium hat, (1) heißt es nun, Forschungsdaten aus abgeschlossenen und laufenden Projekten zu sichten und zu veröffentlichen. Den Anforderungen der Deutschen Forschungsgemeinschaft nachzukommen (2) und gleichzeitig die eigene Forschung bekannter zu machen — das sollte doch lohnen.

Gesagt – getan! Aber welche Daten kann und will man zuerst publizieren? Welche darf man? Bei der zweiten Frage hilft die Dokumentation und die FAQ (3 ), bei der ersten werde ich dann doch unsicher. Bei den älteren Projekten speicherte ich zwar meine Daten (leider nur meistens) unter noch heute interpretierbaren Namen, machte Backups, finde sogar die Speichermedien, aber kann ich diese Dateien jetzt selbst noch nutzen? Und noch wichtiger: Welche Daten sind für die Nachnutzung interessant? Und wie lassen sie sich beschreiben?

[...]

Quelle: http://dhd-blog.org/?p=8798

Weiterlesen

DARIAH-DE Repository gestartet

Presseinformation der Georg-August-Universität Göttingen vom 06.12.2017

Unterstützung für das Management von Forschungsdaten in den Geistes- und Kulturwissenschaften

Geistes- und Kulturwissenschaftlerinnen und -wissenschaftler können ab sofort ihre Forschungsdaten dauerhaft, nachnutzbar und referenzierbar im DARIAH-DE Repository speichern. Im Rahmen von Forschungsprojekten anfallende Daten können dort von Wissenschaftlerinnen und Wissenschaftlern verwaltet und selbstverantwortlich veröffentlicht werden. Das DARIAH-DE Repository baut dabei auf die langjährig erprobte Technologie und Erfahrungen des TextGrid Repositorys auf, unterstützt allerdings sämtliche Datenformate. Darüber hinaus wird das Einspielen von Forschungsdaten mit einem vereinfachten Publikationsprozess über eine Webanwendung ermöglicht.

Daten im DARIAH-DE Repository werden als Open Access unter freien Lizenzen veröffentlicht.

[...]

Quelle: http://dhd-blog.org/?p=8796

Weiterlesen

In Zukunft verbunden

Digitale Infrastrukturen für die Forschung

Digitale Forschungsinfrastrukturen zählen bereits heute zu den Grundbedingungen für exzellente Forschung. Für zukunftssichere Forschungsbedingungen sichert die MWS den Anschluss an die übergreifenden Informationsinfrastrukturen und gestaltet die Entwicklungen mit.

Die Zukunft der digitalen Forschungsinfrastrukturen

In Zeiten multidisziplinärer Verbundforschung mit digitalen Methoden in internationalen Teams lassen sich die dafür notwendigen Infrastrukturen (wie Analysesysteme, Datenzentren, Virtuelle Forschungsumgebungen, etc.) nicht mehr im eigenen Keller betreiben. Aber auch für kleine, fokussierte Vorhaben und die Einzelforschung ohne eigene Kapazitäten sind übergreifende und nachhaltige Angebote für die Forschung unverzichtbar. Auf institutioneller Ebene schließlich ist die Abdeckung der vielfältigen neuen Kompetenzen die größte Herausforderung.

In der Entwicklung dieser digitalen Forschungsinfrastrukturen findet derzeit ein Paradigmenwechsel statt. Bedingt durch Projektförderung und dezentrale Strukturen in den Wissenschaftssystemen ist eine durch Ungleichzeitigkeit und Zersplitterung geprägte Landschaft von Initiativen in der Findungs- oder Experimentierphase entstanden.

[...]

Quelle: http://mws.hypotheses.org/39412

Weiterlesen

Kulturgutdigitalisierung: Was das Stakeholdergremium “Wissenschaftliche Sammlungen” seit einem Jahr beschäftigt

Das Stakeholdergremium “Wissenschaftliche Sammlungen” begleitet seit seiner Gründung 2014 die Arbeit von DARIAH-DE, der digitalen Forschungsinfrastruktur für die Geistes- und Kulturwissenschaften. Das Gremium sorgt für die Anbindung des Projekts an die Fachcommunities und Gedächtnisinstitutionen, die für die alternativ: geistes- und kulturwissenschaftliche Forschung unverzichtbare Partner sind. Neben dieser grundsätzlichen Aufgabe setzt das Gremium eigene Arbeitsschwerpunkte:

Schon auf dem ersten, konstituierenden Treffen in der dritten Projektphase von DARIAH-DE war die programmatische Digitalisierung von Kulturgut in den Fokus des Gremiums gerückt. Seit einem Jahr recherchieren und diskutieren die Mitglieder nun zu Kennzahlen, Anforderungen und technischen und inhaltlichen Herausforderungen der Digitalisierung. Dabei nehmen sie stets eine spezifische Perspektive ein, als ForscherIn einer geisteswissenschaftlichen Disziplin oder als Teil einer Gedächtnisinstitution. Um diese manchmal sehr unterschiedlichen Perspektiven zusammenzubringen, hat sich das Gremium in der dritten Projektphase bisher vier Mal getroffen: im vergangenen August an der SUB Göttingen und im Dezember an der BBAW Berlin, im Mai diesen Jahres an der HAB Wolfenbüttel und im September am Kunsthistorischen Institut der Goethe-Universität in Frankfurt/Main.

Das Gremium will mit seiner Arbeit auch ein Bewusstsein dafür schaffen, dass die vielzitierte „digitale Wende“ in der geisteswissenschaftlichen Forschung ohne Digitalisate nicht zu erreichen ist und die neuen Methoden und Werkzeuge ohne Daten nicht angewendet werden können.



[...]

Quelle: http://dhd-blog.org/?p=8714

Weiterlesen

Call for Abstracts: 8. DINI/nestor-Workshop „Forschungsdatenrepositorien“, 27./28.11., Stuttgart

via Jens Ludwig, Staatsbibliothek zu Berlin

Für die Veröffentlichung von Forschungsdaten gewinnen neben zentralen Fachrepositorien auch institutionelle Repositorien immer mehr an Bedeutung. Zentrale Fachrepositorien bieten eine höhere disziplinspezifische Kompetenz und bessere Vernetzung in der Fach-Community, während institutionelle Repositorien der jeweiligen Institution eine größere Sichtbarkeit geben und auch im Wortsinne „nah an den Forschenden“ sind.
Für Infrastruktureinrichtungen stellen sich viele Fragen, die von strategischen, über organisatorische bis hin zu technischen Gesichtspunkten reichen: In welchen Fällen lohnt sich die Investition in den Aufbau eines eigenen Datenrepositoriums? Ist es sinnvoll, das Angebot eines vorhandenen Publikationsservers um die Funktionalität für Datenpublikationen zu erweitern? Welche Software soll eingesetzt werden? Wie groß darf eine Datenveröffentlichung sein und wie kann sie beschrieben werden? Und welche Qualifikation braucht das Beratungspersonal?

Die DINI/nestor AG Forschungsdaten greift diese und weitere Fragestellungen im Rahmen eines Workshops am 27.

[...]

Quelle: http://dhd-blog.org/?p=8608

Weiterlesen