My last blog post triggered a couple of responses on Twitter. It seems I touched a problem that will not be solved that easily.

Save a date as a Julian calendar date on your Wikibase (manually or, with the /J switch, in your QuickStatements mass input) and your Wikibase will be able to handle this date correctly in any mixed bag of Julian and Gregorian dates. It is nice that the Query Service is able to produce straight timelines out of any such mixed bag, but immensely problematic that you will be quite unable to get any of the Julian dates back in the nominal format in which you stated them on your Wikibase. Blazegraph, the tool that works behind the Query Service, does its job in a normalisation of dates, and this normalisation is, of course, done in the superior Gregorian calendar. Our Wikibase Query Services will hence produce loads of dates that will in their first wave just contradict the documentary evidence. We will then see successive deformations of these dates wherever someone fails to read them as, from here onwards, proper Gregorian. Most databases have a single calendar format: you simply enter all your dates as you read them in your documents or whatsoever source you are exploiting. Gregorianised dates should not enter any such database.




FactGrid Goes NFDI

Friday week before last, we received the news that so many working groups had been eagerly awaiting: the 4Memory consortium (of historical studies) will become part of the Nationale Forschungsdateninfrastruktur (NFDI), the German National Research Data infrastructure.

This is exciting news for FactGrid, just weeks before its fifth birthday. We will be acting as an official repository for historical data in the upcoming NFDI structure. German projects can now make a good case that FactGrid is the optimal platform for their data.

NFDI4Memory task areas

Changing the rules of our present research data management

The German National Research Data Infrastructure aims to bring transparency and sustainability to all research fields, from microbiology to computational linguistics. Whether researchers are still collecting data entirely for themselves in private Word documents and Excel spreadsheets, or whether they are working on digital platforms that are more or less designed like conventional books, designed to be read and looked at – they will face new questions in their research grant applications: Do they produce data? Do they correct publicly available data? If so, the new questions will be: How do they make sure that others can actually work with their data?




Stellenausschreibung für Stud. Hilfskraft (80 oder 2×40 MoStd.), Research Area 5 des Exzellenzclusters „Temporal Communities“, FU Berlin

Die Research Area 5 „Building Digital Communities“ des Exzellenzclusters 2020 „Temporal Communities – Doing Literature in a Global Perspective“ der Freien Universität Berlin sucht studentische Unterstützung (80 bzw. 2×40 MoStd., befristet auf 2 Jahre). Zu den zentralen Tätigkeiten, die mit dieser Stelle verbunden sind, zählen die Unterstützung bei der Aufbereitung, Modellierung und Analyse digital vorliegender Daten, zugeschnitten auf literaturwissenschaftliche Fragestellungen.

Über Bewerbungen aus der Informatik, der Computerlinguistik, der Bibliotheks- oder Informationswissenschaften (oder ähnliches) würden wir uns sehr freuen. Inhaltlich geht es vor allem um Wissens-/Datenmodellierung für die digitalen Geisteswissenschaften.

Technisch ist Expertise in diesen Bereichen gefragt (muss nicht alles zutreffen): Wikibase, APIs (OAI-PMH, REST), RDF, SPARQL, XML-Technologien (XSLT, XQuery, XPath), CIDOC-CRM, FRBR, SKOS, nachgewiesene praktische Kenntnis mindestens einer Programmiersprache (bevorzugt Python oder R).




Imagine a Graph Query Helper for Graph Databases

FactGrid is a graph database. If you run searches in such a database you should rather not think of a resource filled with tables (of people, places, organizations, documents…) that relate to each other but of something more spatial more geometric.

Think of your own knowledge. You will not be able to give a table of all the names that have a meaning in your knowledge or of all the places related to these names. Our knowledge is more like a web of interrelated objects. Nicolaus Copernicus? Is the man who wrote De revolutionibus. What else do you know?




[Praxislabor] Daten kollaborativ handhaben: FactGrid, eine Wikibase Plattform für Historiker*innen

Olaf Simons

Kaum eine Software zieht in den Digital Humanities derzeit ein so großes Interesse auf sich wie Wikibase, die Datenbank-Erweiterung für Mediawikis, die Wikimedia Deutschland federführend für das Wikidata-Projekt entwickelte.
Das hat zum einen mit dem Wikidata Projekt selbst zu tun, das sich in den letzten Jahren zum Brückenkopf zwischen den verschiedensten Datenbankprojekten entwickelte. Das hat im selben Moment damit zu tun, dass die größeren Bibliothekskonsortien diese Software soeben im Interesse an einem in Zukunft globalen Normdatenaustausch evaluieren.
Vor allem die konzeptionelle Offenheit und Transparenz der Software besticht: Konsequent Trippel-basiert meidet Wikibase die Einengungen herkömmlicher relationaler Datenbanken. Beliebige Datenbankobjekte lassen sich in beliebige Beziehungen zueinander setzen, ohne dass Nutzer vorab wissen müssen, welcherart Statements sie mit der Zeit generieren werden. Standard-Visualisierungen sind mit dem SPARQL-Endpoint im Angebot der freien open source Software. Datenein- und -Ausgabe sind unkompliziert gestaltet. Vor allem aber frappiert die mehrsprachige Nutzbarkeit: Daten lassen sich in beliebigen Sprachen ein- und in andern auslesen – die ideale Voraussetzung für international vernetzte Projekte.




Einblicke in das interne Berichtswesen des Illuminaten-Ordens. Aus der Hand Hermann Schüttlers: 71 Dokumente der Jahre 1781 bis 1785

Die folgende Materialpräsentation ist das Ergebnis eines zweimonatigen Praktikums im Forschungszentrum Gotha. Mein Projekt war es, der Forschung Vorarbeiten zu einem unvollendet gebliebenen Buchprojekt Hermann Schüttlers datenbankgestützt auf den FactGrid-Seiten zugänglich zu machen. Es handelte sich hierbei um Transkriptionen von 71 Dokumenten aus dem inneren Machtzirkel des Illuminatenordens der Jahre 1781 bis 1785. Im Gegensatz zu den von Hermann Schüttler und Reinhard Markner zuvor bereits vorgelegten Bänden der Illuminatenkorrespondenz steht hier das interne Berichtswesen des Ordens im Zentrum. Das Corpus birgt:

  • 12 für den Orden verfasste (Auto-)biographien,
  • 26 Inspektionsberichte,
  • 29 Sitzungsprotokolle der bisher wenig bekannten “zweiten” Minervalkirche Frankfurts; zu ihnen kommen drei Protokolle der Gothaer Minervalkirche und eines aus Weimar.

Es galt dabei erstens, die unterschiedlich umfangreich verfußnoteten Transkripte im Gesamtumfang von bislang 237 Seiten von ihren Word-Dateien in Wiki-Seiten des FactGrid zu überführen, sie dabei mit kurzen Einleitungen zu versehen und die Fußnotung an die Datenbank anzukoppeln oder in einem Großteil der Dokumente erst durch eigene Recherche zu erstellen – bei den Inspektionsberichten kamen im Extremfall über 200 Fußnoten im Einzeldokument in den Blick.




SHK-Stelle mit Schwerpunkt Wikibase am Exzellenzcluster „Temporal Communities“ der FU Berlin

Der Exzellenzcluster 2020 „Temporal Communities – Doing Literature in a Global Perspective“ der Freien Universität Berlin sucht die Unterstützung von studentischen Mitarbeiter*innen (80 bzw. 2×40 Monatsstunden) bei der Betreuung und Weiterentwicklung einer Wikibase-Instanz für in-house Forschungsdatenmanagement in der Research Area 5 „Building Digital Communities„.

Mehr Informationen finden Sie im Stellenanzeiger der Freien Universität Berlin. Bewerbungsschluss ist der 3. November 2020.

Studentische Bewerber*innen müssen nicht unbedingt an der Freien Universität Berlin immatrikuliert sein, sondern können auch an einer anderen Berliner Hochschule oder in Potsdam studieren. Verbreiten Sie die Ausschreibung gern weiter!




Filling a Wikibase instance with Millions of Data

As more and more Wikibase instances are coming into existence we are seeing attempts to start them with masses of data from already existing data bases that switch to the new software.

Experimenting I tried to find a faster way to insert a huge amount of items into a Wikibase instance. I have not been able to insert more than two or three statements per second using the ‘official’ tools, such as QuickStatements or the WDI library.

Therefore, I am inserting the data directly into the MySQL database used by Wikibase.

The process consists of these steps:

  • generate the data for an item in JSON
  • determine the next Q number and update the JSON item data accordingly

  • [...]



FactGrid GYIK – Miért használjam a FactGridet a kutatási projektemhez?

The first volume of the Thuringian pastor’s book (1500–1920) as a Wikibase data set German version via Google Translate

In a tremendous effort of a year’s of work, Heino Richard of the Genealogical Society of Thuringia e.V., step by step translated the first volume of the Thuringian Pastors’ Books (the volume for the former Duchy of Gotha) into data which we could now feed into FactGrid: More than 13,300 database objects are stemming from this work allowing now entirely new explorations of the territory’s social and religious history. We as curious about the joint ventures this work might inspire. There is no reason to fear that the database version will render all further work on the paper-based volumes obsolete, the platform might, however, offer itself to the editors of the Pfarrerbuch as an unexpected aid.

The eight volumes cover all the parishes of the former Thuringian territories from the Reformation to the 20th century. A first survey is prefixed in each volume to give all the all the parishes and offices with lists of the pastors and auxiliaries who held the respective offices. The main part is in each volume devoted to the individual biographies.


