Pythons and Witchcraft? Programmieren ist (k)ein Hexenwerk

a yellow python with a blue witch hat
Python-Witch, Sarah Rebecca Ondraszek, CC-BY 4.0
Die Kunst des Codens

Beim Arbeiten mit (Forschungs-)daten ist heutzutage das Programmieren, oder zumindest das Skripten, eigentlich schon eine Grundvoraussetzung. Historikerinnen, die OCR-Pipelines bauen und Literaturwissenschaftler, die Sprachmodelle mit neuronalen Netzen entwickeln; man wird zum Jongleur mehrerer Disziplinen, zur Trapezkünstlerin und zur Hochseiltänzerin im Lianen-Dschungel der Technologie.
Die damit verbundenen Gefühle können jedoch (verständlicherweise) schnell Programmier-Willige abschrecken. Wer möchte schon, ohne Sicherung wohlgemerkt, auf einer Liane im Dschungel Hochseiltänzerin sein? Womöglich begegnet man auch noch einer Python.

Das riesige Angebot an Tools ähnelt nun doch recht passend einem Dschungel, so findet man sich vor allem als blutiger Anfänger nicht darin zurecht. Ausgestattet mit Links zur „Codecademy“, dem „Learn How To Code in 24 Hours“, dem „Programming Historian“ und einer Machete macht man sich also auf den Weg ins Abenteuer Programmieren: Das wäre wirklich schön, nicht?



[...]

Quelle: https://dhdhi.hypotheses.org/6892

Weiterlesen

Stellenausschreibung für Stud. Hilfskraft (80 oder 2×40 MoStd.), Research Area 5 des Exzellenzclusters „Temporal Communities“, FU Berlin

Die Research Area 5 „Building Digital Communities“ des Exzellenzclusters 2020 „Temporal Communities – Doing Literature in a Global Perspective“ der Freien Universität Berlin sucht studentische Unterstützung (80 bzw. 2×40 MoStd., befristet auf 2 Jahre). Zu den zentralen Tätigkeiten, die mit dieser Stelle verbunden sind, zählen die Unterstützung bei der Aufbereitung, Modellierung und Analyse digital vorliegender Daten, zugeschnitten auf literaturwissenschaftliche Fragestellungen.

Über Bewerbungen aus der Informatik, der Computerlinguistik, der Bibliotheks- oder Informationswissenschaften (oder ähnliches) würden wir uns sehr freuen. Inhaltlich geht es vor allem um Wissens-/Datenmodellierung für die digitalen Geisteswissenschaften.

Technisch ist Expertise in diesen Bereichen gefragt (muss nicht alles zutreffen): Wikibase, APIs (OAI-PMH, REST), RDF, SPARQL, XML-Technologien (XSLT, XQuery, XPath), CIDOC-CRM, FRBR, SKOS, nachgewiesene praktische Kenntnis mindestens einer Programmiersprache (bevorzugt Python oder R).



[...]

Quelle: https://dhd-blog.org/?p=18031

Weiterlesen

Twitter als Quelle – Einige Beobachtungen zum Twitterarchiv der #DHd2022

Abbildung 1 – Tweets pro Stunde während der Konferenztage

„Kulturen beruhen auf Erinnerung, auf Praktiken der Speicherung und der Überlieferung.“[1] Mit diesem Satz leitete der Verband der Digital Humanities im deutschsprachigen Raum seine 8. Jahrestagung ein, die eigentlich in Potsdam geplant, dann aber komplett virtuell ausgetragen wurde. Was heißt das für eine Tagung, die sich dem Einfluss der Digitalisierung auf unsere Kulturpraktiken widmen sollte? Welche Spuren im digitalen Raum hinterlässt die Tagung? Was davon wird wie gespeichert?

Native digitale Quellen werden in der Geschichtswissenschaft noch selten ausgewertet. Doch werden sie in der Zukunft eine immer größere Rolle spielen. Kathrin Passig stellte sich dieser Frage in der Closing Keynote: vom SciHub über das WebArchive bis zum deutschen Twitter Archiv, was gilt es zu archivieren und was brauchen wir dafür?

[...]

Quelle: https://dhd-blog.org/?p=17812

Weiterlesen

Digitales Praxislabor 2022 (Digital History)

Eine Veranstaltungsreihe der AG Digitale Geschichtswissenschaft

Aufgrund der hohen Nachfrage bietet dies AG Digitale Geschichtswissenschaft (VHD) auch in diesem Jahr eine Veranstaltungsreihe zu digitalen Methoden und Tools rund um die historische Forschung an. Sie sind herzlich eingeladen, eine oder mehrere dieser Veranstaltungen wahrzunehmen. Das Programm bietet ein reiches Spektrum von Angeboten im Umgang mit qualitativen und quantitativen Methoden sowie zur Strukturierung, Bereinigung, Anreicherung und Publikation von Daten. Auf den Websites der AG Digitale Geschichtswissenschaft finden Sie allgemeine Hinweise und Beschreibungen zum Workshop-Programm. Diese führen Sie zu den jeweiligen individuellen Informationsangeboten der Workshop-Anbieter. Bitte beachten Sie, dass Aktualisierungen und Anmeldungsmöglichkeiten nur auf diesen letztgenannten Websites gegeben werden.

Mit herzlichen Grüßen, im Namen des Komitees der AG Digitale Geschichtswissenschaft
Katrin Moeller

Workshopbild



[...]

Quelle: https://dhd-blog.org/?p=17699

Weiterlesen

Einführung in Python für Historiker:innen

Martin Dröge, Melanie Althage, Professur für Digital History, Humboldt-Universität zu Berlin

Termin: Dienstag, 08.11.2022, 10.00-16.00 Uhr

Beschreibung:

Das Programmieren mit Python erfreut sich immer größerer Beliebtheit: Mit der höheren Mehrzweck-Programmiersprache können sowohl numerische als auch textuelle Daten gut verarbeitet werden – zudem ist sie einfach zu erlernen. Das Ziel des Workshops ist es, Historiker:innen ganz praktisch an die Skriptsprache Python heranzuführen und deren Potentiale für weitere Forschungsansätze aufzuzeigen. Die Einführung gibt zunächst einen Überblick über die Eigenschaften von Python, vermittelt Grundkenntnisse in Syntax und Wortschatz und macht mit Arbeitsumgebungen wie den Jupyter-Notebooks vertraut, die programmierenden Historiker:innen zur Verfügung stehen.

[...]

Quelle: https://digigw.hypotheses.org/4084

Weiterlesen

Einführung in Topic Modeling mit Python

Melanie Althage, Martin Dröge, Professur für Digital History, Humboldt-Universität zu Berlin

Termin: Dienstag, 15.11.2022, 10:00-16:00 Uhr

Beschreibung:

Umfangreiche Textkopora inhaltlich strukturieren und auswerten ohne die Dokumente im Einzelnen gelesen zu haben – geht das? Das geht! Topic Modeling ist eine in den digitalen Geisteswissenschaften etablierte Methode, wenn es etwa darum geht, größere Textsammlungen inhaltlich-thematisch zu klassifizieren oder die Entwicklung von Publikationstrends und Diskursen nachzuvollziehen. Der Workshop bietet eine einsteigerfreundliche Einführung in ihre methodischen Grundlagen sowie die Implementierung mittels der Programmiersprache Python. Anhand eines konkreten Anwendungsfalls wird der Topic-Modeling-Workflow von der Vorbereitung der Textdaten bis zur Visualisierung und ersten Auswertung der Modellierungsergebnisse Schritt für Schritt durchgegangen.

[...]

Quelle: https://digigw.hypotheses.org/4090

Weiterlesen

[Praxislabor] Python Basics und erste Anwendungsbeispiele im Bereich Web Scraping und Text Mining

Martin Dröge

Es ist zwar nicht eingetreten, was der französische Historiker Emmanuel Le Roy Ladurie 1968 in der Wochenschrift ‘Le Nouvel Observateur’ schrieb: „Der Historiker von morgen wird Programmierer sein oder es wird ihn nicht mehr geben“.((König, Mareike (2015): „Digitale Geschichtswissenschaft – Einleitung #dguw15“. http://dguw.hypotheses.org/84.)) Dennoch erleichtern Kenntnisse im Programmieren auf vielfältige Weise die Arbeit von Historiker*innen, nicht zuletzt angesichts einer immer weiter ansteigenden digitalen Datenflut. Große Korpora von Texten, Bildern und anderen Digitalisaten lassen sich mithilfe kurzer Skripte erfassen, aufbereiten und weiterverarbeiten, sei es im Rahmen der Heuristik, Quellenkritik, Interpretation oder Darstellung.

Das Ziel des Workshops ist es, noch nicht digital arbeitende Historiker*innen ganz praktisch an neue, digitale Methoden heranzuführen und deren Potentiale für weitere Forschungsansätze zu zeigen.

[...]

Quelle: https://digigw.hypotheses.org/3781

Weiterlesen

Workshop “Metadaten Analysieren” der DHd-AG Zeitungen & Zeitschriften

von Nanette Rißler-Pipka, Harald Lordick und Torsten Roeder

Während viele Millionen Zeitungs- und Zeitschriftenseiten in Portalen wie Europeana oder der Deutschen Digitalen Bibliothek am Bildschirm lesbar sind, steht maschinenlesbarer Text nur in kleinen Mengen der Forschung zur Verfügung. Schade, denkt man: Damit kann man ja nur begrenzt etwas anfangen. Doch all diese Digitalisate sind katalogisiert und manchmal sogar zu einem Anteil bis auf die Inhaltsverzeichnisse jeder Ausgabe, also bis auf Artikelebene erfasst. Für Zeitungen und Zeitschriften sind diese zusätzlichen Informationen schon durch die Struktur des Mediums besonders reichhaltig und wichtig.

Diese Informationen nennen wir “Metadaten”.[1] Und es ist gut, dass es sie gibt: Sie verraten uns zum einen in systematischer Form das, was aus den Digitalisaten explizit hervorgeht, wie etwa  den Namen der Zeitung/Zeitschrift, den Druckort, das Erscheinungsdatum. Zum anderen enthalten sie beispielsweise auch die Regelmäßigkeit des Erscheinens, die Anzahl der gescannten und der gedruckten Exemplare, die Autorinnen und Autoren sowie weitere Akteure, die Anzahl der Seiten und der Artikel oder die Sprache, in der die Artikel verfasst wurden. All dies kann viel Recherche erfordern.

[...]

Quelle: https://dhd-blog.org/?p=14457

Weiterlesen

SHK-Stelle mit Schwerpunkt Textmining und Analyse literarischer Textkorpora im Projekt „Digital Literacy in den Geisteswissenschaften“ an der FU Berlin

Der Exzellenzcluster 2020 „Temporal Communities – Doing Literature in a Global Perspective“ der Freien Universität Berlin sucht die Unterstützung von studentischen Mitarbeiter*innen bei der Handhabung und Analyse literarischer Textkorpora. Auf die Stelleninhaber*innen warten u.a. spannende Programmieraufgaben wie Textmining mit R und/oder Python (z.B. Frequenz-, Netzwerk-, Sentiment- und Clusteranalysen), sowie auch Unterstützung bei der Datenaggregation und der Vorverarbeitung textbasierter Daten.

Mehr Informationen finden Sie im Stellenanzeiger der Freien Universität Berlin. Bewerbungsschluss ist der 19.07.

[...]

Quelle: https://dhd-blog.org/?p=14039

Weiterlesen

Job: Wissenschaftlicher Mitarbeiter (m/w/d) 50% TV-L 13 Digital Humanities (Berlin – DHI Rom) – verlängerte Bewerbungsfrist (8.3.2020)


Das Deutsche Historische Institut in Rom  sucht für das von der DFG geförderte digitale Editionsprojekt „Ferdinand Gregorovius: Poesie und Wissenschaft. Gesammelte deutsche und italienische Briefe„, das in Zusammenarbeit mit der Arbeitsgruppe TELOTA der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) entwickelt wird, schnellstmöglich, zunächst für einen befristeten Zeitraum von einem halben Jahr

eine/-n wissenschaftliche/-n Mitarbeiter/-in (w/m/d) für Digital Humanities in Teilzeit zu 50% der tariflichen Arbeitszeit.  

Im Falle der vorgesehenen Verlängerung des Projekts besteht die Möglichkeit der Vertragsverlängerung um ein weiteres Jahr. Möglich ist auch eine Vollzeitbeschäftigung in den ersten drei Monaten.

Das Deutsche Historische Institut in Rom ist ein Forschungsinstitut der Max Weber Stiftung – Deutsche Geisteswissenschaftliche Institute im Ausland. Das 1888 gegründete Institut dient der Erforschung der italienischen und deutschen Geschichte und Musikgeschichte in europäischen Zusammenhängen, vom frühen Mittelalter bis zur jüngsten Vergangenheit.  



[...]

Quelle: https://dhd-blog.org/?p=12963

Weiterlesen