Data, Data, there to Crawl, Who’s the Fairest of Them All?

Des cirCONSTANCEs plus faires – Von Korrespondenznetzwerk zu Wissensgraph mit der Briefedition »Constance de Salm«  

Foto von thom masat auf Unsplash

Die Gemeinsamkeit zwischen Energy Drinks, die ich während meines Praktikums am DHIP getrunken habe, und der Arbeit an einer digitalen Briefedition?
Beides kann die Herzschlagrate schlagartig erhöhen.
Aber: Auch das Stichwort „Recycling“ spielt hier eine Rolle. Forschungsdaten und ihre Nachnutzbarkeit werden immer wieder diskutiert; und das nicht nur im Seminar “Methoden der Digital Humanities” an der Uni Trier…

Offene und faire Daten – Etwas Theorie als Apéritif

Für viele Disziplinen, die bereits traditionell und analog mit Daten arbeiten bzw. diese erzeugen, sind Digitalisierung, Linked Open Data und FAIRification wichtige Themen[1]. Bereits zu Beginn eines Projekts sollte die Zukunft der Forschungsdaten bedacht werden. Dabei geht es auch darum, den Umgang mit Daten transparent(er) zu gestalten. Ähnlich wie beim Recyclen meiner etlichen Energy-Drink-Dosen, sollten auch die Forschungsdaten, möglicherweise in neuer Form, weiterleben können, nachdem sie von Forschenden verzehrt—ich meine natürlich verwendet—wurden. FAIR steht dabei für findable, accessible, interoperable und reusable.

[...]

Quelle: https://dhdhi.hypotheses.org/7456

Weiterlesen

Ein experimenteller Workflow für die Edition der Korrespondenz der Constance de Salm (1767-1845) 

Das umfangreiche Korpus der Korrespondenz der Constance de Salm (ca. 11.000 Stücke) besteht aus sehr unterschiedlichen Dokumenttypen (Originale, Entwürfe, Abschriften), die auf losen Blättern oder in gebundenen Büchern vorliegen und zudem von vielen verschiedenen Händen kopiert und abgeschrieben wurden. Anlässlich meines Praktikums von April bis Juli 2022 am DHIP im Rahmen des Masterstudiengangs “Technologies numériques appliquées à l’histoire” (École nationale des chartes) habe ich einen halbautomatisierten Workflow für die Erstellung einer digitalen Edition dieser Korrespondenz eingerichtet.

Eine vollständige Umsetzung der Verarbeitungskette wäre für ein viermonatiges Praktikum zu umfangreich gewesen, daher war hier das Erarbeiten eines Pilot-Workflows das Ziel, um die zukünftige Arbeit an der Edition zu erleichtern. So wurden drei Probleme angegangen, die sich bei jeder nativ-digitalen Edition eines sehr umfangreichen Korpus stellen:

  1. Das Seitenlayout von Dokumenten zu analysieren (durch Training eines Modells zur Segmentierung von Seiten);
  2. Ein Modell zu produzieren, das die Handschriften verschiedener Kopisten erkennen kann, und die Trainingsmethode wiederholbar zu machen;
  3. Eine Strukturierung der Ausgabe im TEI-Format zu erzielen, Buchstabe für Buchstabe, aus Quellen, in denen sie gemeinsam hinein kopiert worden waren.

    [...]

Quelle: https://dhdhi.hypotheses.org/6847

Weiterlesen

“Je pars, je vais revoir les rives de la Seine…” – Constance de Salm twittert ihre Briefanfänge

Ob die französische Schriftstellerin Constance de Salm (1767-1845) heutzutage wirklich twittern würde, wissen wir nicht. Aber gefallen würde ihr unser Projekt bestimmt, denn sie war überzeugt, dass ihre ausgiebige Briefkorrespondenz mit illustren Persönlichkeiten des beginnenden 19. Jahrhunderts die breite Öffentlichkeit interessieren würde. Für eine Edition ihrer Briefe hat sie zahlreiche Abschriften anfertigen lassen. Publiziert wurden zu Lebzeiten jedoch nur rund dreißig Briefe. Die von ihr geplante Zusammenstellung aller Briefe als “Correspondance générale” konnte sie nicht umsetzen, aber über 250 Jahre später haben wir ihr diesen Wunsch erfüllt mit dem gerade überarbeiteten Editions- und Erschließungsprojekt des DHIP, das die Briefbestände aus Toulon und Schloss Dyck digital vereint[1].

Um die nun frei zugänglichen Briefe von Constance de Salm samt angereicherten Metadaten insbesondere in Frankreich zu bewerben, haben wir (Anne Baillot, Eike Martin Löhden und ich) den Datathon des DHI und DFK vom 24.-26.11.

[...]

Quelle: https://dhdhi.hypotheses.org/6705

Weiterlesen

Fairification und Relaunch der Datenbank “Korrespondenz der Constance de Salm (1767-1845)”

Die freie Zugänglichkeit und dauerhafte Nachnutzung von Forschungsdaten nach den derzeit hoch im Kurs stehenden FAIR-Prinzipien sind nicht nur für aktuelle Forschungsprojekte bedenkenswerte Ziele. Sie können genauso für alternde digitale Projekte Anwendung finden, bei denen eine Datenkuratierung im Hinblick auf Verknüpfung mit Metadaten und Zugänglichkeit notwendig ist und die verwendete Weboberfläche zur Abfrage nicht mehr den Konsultations- und Ergonomiestandards des gegenwärtigen Web entspricht. Am DHIP gibt es gleich mehrere solcher Projekte: über die in Kooperation mit dem Institut für Digital Humanities in Köln neu aufgesetzte Datenbank “Adressbuch der Deutschen von 1854” wurde hier im Blog schon berichtet. Im Folgenden geht es um die Erschließungsdatenbank der Korrespondenz der Constance de Salm (1767-1845).

Rückseite eines Briefs von Constance de Salm mit ihrer Unterschrift an Paul-Philippe Gudin de La Brenellerie, 8.6.1808, C04_S027_0005, https://constance-de-salm.de/archiv/#/document/5625.

Das Schicksal dieser Projekte ist aus meiner Sicht deshalb interessant, weil es in mancher Hinsicht typisch sein dürfte für digitale Projekte aus den 2000er und frühen 2010er Jahren.

[...]

Quelle: https://dhdhi.hypotheses.org/6646

Weiterlesen

Erschließungsdaten des Projekts „Die Korrespondenz der Constance de Salm (1767-1845)“ jetzt in correspSearch nachgewiesen

Cluster in VIAF der Einträge von Jean-Louis Alibert (1768-1837) in den nationalen Normdaten

Seit gut einem Jahr beschäftigt uns der Relaunch des Projekts Die Korrespondenz der Constance de Salm (1767-1845), eine Erschließungs- und Digitalisierungsdatenbank des DHIP, online seit 2013, und damit in verschiedener Hinsicht in die Jahre gekommen. Die Datenbank verzeichnet rund 11.000 Briefe von oder an die französische Schriftstellerin bzw. aus dem Umfeld von Constance de Salm. Die Originale werden in zwei verschiedenen Archiven aufbewahrt: Fonds Salm der Société des Amis du Vieux Toulon et de sa Région und der Bestand Constance de Salm im Archiv Schloss Dyck (Mitgliedsarchiv der Vereinigten Adelsarchive im Rheinland e.V.). Ziele des nunmehr fast abgeschlossenen Relaunches sind eine zweisprachige Weboberfläche, der freie Zugang auf die Digitalisate ohne Wasserzeichen sowie ein Datenbankupdate und eine schlankere Navigation.



[...]

Quelle: https://dhdhi.hypotheses.org/6552

Weiterlesen

Kooperationsprojekt mit dem IDH Köln zum Relaunch der Datenbank „Adressbuch der Deutschen in Paris von 1854“

Ansicht einer gescannten Seite des Adressbuch von 1854

Das DHIP kooperiert mit dem Institut für Digital Humanities (IDH) der Universität zu Köln beim Relaunch einer Datenbank, die am DHIP im Rahmen eines Forschungsprojekts von 2003-2006 entstanden ist. Die Datenbank Adressbuch der Deutschen in Paris von 1854 verzeichnet 4.772 Adressen, überwiegend von deutschen Handwerkern und Kaufleuten, die in Paris und den angrenzenden Vororten ansässig waren. Grundlage für die Datenbank ist ein gedrucktes Buch aus dem Jahr 1854, eine Art frühe „Gelbe Seiten“, das sich im Bestand der Bibliothèque historique de la ville de Paris befindet. Die 2006 online gestellte Datenbank ist mittlerweile in vielerlei Hinsicht veraltet, vor allem stehen die Daten bisher nicht als Open Data zur Verfügung. Ziel der Kooperation beider Institute ist – neben technischen und graphischen Updates ­– die Restrukturierung und Anreicherung der Daten und ihre Publikation im Open Access unter einer freien CC-Lizenz, um sie für die Forschung nachnutzbar zu machen[1].

Das neue Web-Interface wurde mithilfe des Frameworks CakePHP entwickelt. Es ermöglicht die übersichtliche Anzeige aller aufgenommenen Einträge des Adressbuchs (Personen und Unternehmen), die neben Name und Adresse auch weitere Informationen enthalten.

[...]

Quelle: https://dhdhi.hypotheses.org/6522

Weiterlesen

Constance de Salm: zweite Hälfte des Nachlasses wird digitalisiert und erschlossen

image2Der reichhaltige und für die deutsch-französische Kulturgeschichte der Sattelzeit sehr wertvolle Bestand der Korrespondenz der Schriftstellerin und Salonnière Constance de Salm (1767-1845) aus dem Musée du Vieux Toulon wurde zwischen 2011 und 2013 am DHIP mithilfe des Forschungs- und Datenbanksystems (FuD) der Universität Trier erschlossen. Die Ergebnisse stehen seit Dezember 2013 unter www.constance-de-salm.de online: die Datenbank enthält alle Eckdaten (Datum, Auto bzw. Absender, Empfänger, Ort, Anzahl der Seiten, Vollständigkeit), sowie eine Zusammenfassung des Inhalts jedes einzelnen Dokumentes, mit Transkription des Beginns der Briefe, zur besseren Identifizierung. Eine Suche nach Schlagworten, Personen, geographischen Namen, Jahreszahl bzw. Zeitspanne ist auch möglich. Nach Online-Anfrage können Forschende zusätzlich auf die entsprechenden Digitalisate zugreifen.

Nach der Entdeckung im Frühjahr 2013, bei einem französischen Antiquariat, eines größeren Archivbestandes von Constance de Salm, der sich nach kurzen Nachforschungen als zweite Hälfte des Nachlasses in Toulon erstellte (diese Dokumente waren von einem Wissenschaftler entliehen und nie zurückgegeben worden), wurde beschlossen, diese Unterlagen nachträglich in das Projekt zu integrieren.

[...]

Quelle: https://dhdhi.hypotheses.org/2560

Weiterlesen

Blog carnival: Experiments in Digital Humanities #dhiha6

2679496291_9461f9c5e4_zCall for blog posts as part of the conference #dhiha6 – “Experiments in Digital Humanities”

On June 12th 2015 the 6th Digital Humanities conference will be held in Paris. The event is organized by the German Historical Institute, the Cléo, the Paris Institute for Advanced Studies and European Science Foundation and the day will revolve around thethe theme of “experiments”. It will be an opportunity to test research practices and question the “scientific” approach of the Human and Social Sciences favored by the development of Digital Humanities.
In the course of this new edition the organizers call for blog posts on the topic of “Experiments in Digital Humanities.”

Thus, four research practices will be explored:

  1. The classical Call for Papers or Articles becomes a Call for Blog Posts.
  2. These posts will then be submitted to the Open Peer Review Process (OPR), an as of yet largely untested process which must be developedfurther.poorly exploited process and on which the changes are to be made.
  3. The “OPR-Sprint”, an Open Peer Review which is to take place over just a  few hours over the course of the symposium and which aims to test the online publishing of blog posts and the integration of comments.
  4. The publication of notes and “conference proceedings” online, following the OPR and  the integration of comments by the authors.

A list of potential topics is proposed here, though it is not exhaustive:

  • Laboratories and experimentation in SSH
  • Developing intellectual issues through experiments
  • Interpretation as an experiment
  • The value of failure in Science
  • Collaborative experiments: Citizen Science, crowdsourcing
  • Data-Experiments and Visualization
  • Research infrastructure as a space for experiments
  • Interdisciplinary experiments
  • Protocoling experiments in SSH
  • Teaching experiments in SSH

Posts are expected between April 20 and May 31st 2015 and they can be written in French, German or English. Please, use the hashtag #dhiha6 and post your article in the comments sections of this post. Please send it also to the following address: sdumouchel [at] dhi-paris.fr

logo-IEAESF_green_logo

 

 

 

 

_______________________

image credits: Streichholz? by kari_bum, licece: CC BY-NC 2.0

Quelle: http://dhdhi.hypotheses.org/2416

Weiterlesen

Blog carnival: Experimente in den Digital Humanities #dhiha6

8579313013_addda5b464_kCall for Blogartikel im Rahmen des Studientages #dhiha6 – “Experimente in den Digital Humanities”

Am 12. Juni findet in Paris die sechste Ausgabe des Studientages zu den Digital Humanities statt, organisiert vom Deutschen Historischen Institut Paris, dem Cléo, dem Institut d’études avancées und der European Sciences Foundation. Der Studientag zum Thema „Experimente“ stellt die Möglichkeit dar, Praktiken zu testen und die „wissenschaftliche“ Herangehensweise der Geistes- und Sozialwissenschaften zu hinterfragen, ein Themenfeld, das durch die Entwicklung der Digital Humanities begünstigt wird.

Aus diesem Grund und um diese sechste Ausgabe der Tagungsreihe gebührend zu begehen, rufen die Organisatoren in diesem Jahr zu einem Call for Blogartikel zum Thema „Experimente in den Digital Humanities“ auf. Dieser Call bietet so die Gelegenheit, vier Forschungspraktiken zu erproben:

  1. Der Call for Papers als ein Call for Blogartikel.
  2. Diese Blogartikel durchlaufen anschließend ein Open Peer Review (OPR)-Verfahren, ein noch wenig erprobtes und in Zukunft weiterzuentwickelndes Verfahren.
  3. Der „OPR-Sprint“, d.h. ein Open Peer Review binnen weniger Stunden während des Studientages, dient dem Testen der Onlinepublikation der Blogartikel und des Einbezuges der Kommentare.
  4. Abschließend erfolgt die Publikation der Blogartikel sowie (ebenso online) der Beiträge des Studientages, ausgehend vom OPR und nach Einarbeitung der Kommentare durch die Autoren der Blogartikel.

Einige Themen werden an dieser Stelle vorgeschlagen, wobei die Liste nicht vollständig ist und Blogbeiträge gern darüber hinaus gehen können:

  • Labore und Experimente in den Geistes- und Sozialwissenschaften
  • Entwicklung von Forschungsproblematiken durch Experimente
  • Interpretation als Experiment
  • Scheitern im Forschungsprozess
  • Forschungsinfrastukturen als Raum für Experimente
  • Interdisziplinäre Experimente
  • Einführung eines Versuchsprotokoll in den Geistes- und Sozialwissenschaften
  • Gemeinschaftliche Experimente: Wissenschaft und Gesellschaft, Crowdsourcing
  • Visualisierung von und Experimente mit Daten
  • Lehren von Experimenten in den Geistes- und Sozialwissenschaften

Die Blogbeiträge sollen zwischen dem 20. April und dem 31. Mai 2015 auf Französisch, auf Deutsch oder auf Englisch publiziert werden. Bitte verwenden Sie den Hashtag #dhiha6 im Titel und verlinken Sie den Artikel in einem Kommentar unter diesen Beitrag. Die Beiträge bitte gleichzeitig an die folgende Mailadresse schicken: sdumouchel [at] dhi-paris.fr. Wir sind gespannt auf die Beiträge!

logo-IEAESF_green_logo

 

 

 

 

______________________

Abbildung: Chemistry Spectacular von Wellington College, Lizenz CC BY-NC 2.0

Quelle: http://dhdhi.hypotheses.org/2405

Weiterlesen

Blog carnival: Experimente in den Digital Humanities #dhiha6

8579313013_addda5b464_kCall for Blogartikel im Rahmen des Studientages #dhiha6 – “Experimente in den Digital Humanities”

Am 12. Juni findet in Paris die sechste Ausgabe des Studientages zu den Digital Humanities statt, organisiert vom Deutschen Historischen Institut Paris, dem Cléo, dem Institut d’études avancées und der European Sciences Foundation. Der Studientag zum Thema „Experimente“ stellt die Möglichkeit dar, Praktiken zu testen und die „wissenschaftliche“ Herangehensweise der Geistes- und Sozialwissenschaften zu hinterfragen, ein Themenfeld, das durch die Entwicklung der Digital Humanities begünstigt wird.

Aus diesem Grund und um diese sechste Ausgabe der Tagungsreihe gebührend zu begehen, rufen die Organisatoren in diesem Jahr zu einem Call for Blogartikel zum Thema „Experimente in den Digital Humanities“ auf. Dieser Call bietet so die Gelegenheit, vier Forschungspraktiken zu erproben:

  1. Der Call for Papers als ein Call for Blogartikel.
  2. Diese Blogartikel durchlaufen anschließend ein Open Peer Review (OPR)-Verfahren, ein noch wenig erprobtes und in Zukunft weiterzuentwickelndes Verfahren.
  3. Der „OPR-Sprint“, d.h. ein Open Peer Review binnen weniger Stunden während des Studientages, dient dem Testen der Onlinepublikation der Blogartikel und des Einbezuges der Kommentare.
  4. Abschließend erfolgt die Publikation der Blogartikel sowie (ebenso online) der Beiträge des Studientages, ausgehend vom OPR und nach Einarbeitung der Kommentare durch die Autoren der Blogartikel.

Einige Themen werden an dieser Stelle vorgeschlagen, wobei die Liste nicht vollständig ist und Blogbeiträge gern darüber hinaus gehen können:

  • Labore und Experimente in den Geistes- und Sozialwissenschaften
  • Entwicklung von Forschungsproblematiken durch Experimente
  • Interpretation als Experiment
  • Scheitern im Forschungsprozess
  • Forschungsinfrastukturen als Raum für Experimente
  • Interdisziplinäre Experimente
  • Einführung eines Versuchsprotokoll in den Geistes- und Sozialwissenschaften
  • Gemeinschaftliche Experimente: Wissenschaft und Gesellschaft, Crowdsourcing
  • Visualisierung von und Experimente mit Daten
  • Lehren von Experimenten in den Geistes- und Sozialwissenschaften

Die Blogbeiträge sollen zwischen dem 20. April und dem 31. Mai 2015 auf Französisch, auf Deutsch oder auf Englisch publiziert werden. Bitte verwenden Sie den Hashtag #dhiha6 im Titel und verlinken Sie den Artikel in einem Kommentar unter diesen Beitrag. Die Beiträge bitte gleichzeitig an die folgende Mailadresse schicken: sdumouchel [at] dhi-paris.fr. Wir sind gespannt auf die Beiträge!

logo-IEAESF_green_logo

 

 

 

 

______________________

Abbildung: Chemistry Spectacular von Wellington College, Lizenz CC BY-NC 2.0

Quelle: http://dhdhi.hypotheses.org/2405

Weiterlesen