Topic Modeling – Planet Clio

Data Stories, DiaCollo, digital history, Digitale Methoden, Forschung (Methode), Forschungsdaten, fud, Geodaten, Lehre und Ausbildung, Linked Open Data, Normdaten, Online-Quellenedition, OpenRefine, Ortsnamenverzeichnisse, Python, quantitative Methoden, RDF, Schulung/Tutorial, semantic web, SPSS, Topic Modeling, webinar, wissenschaftliches bloggen

Digitales Praxislabor 2022 (Digital History)

5. April 2022 Keine Kommentare

Eine Veranstaltungsreihe der AG Digitale Geschichtswissenschaft

Aufgrund der hohen Nachfrage bietet dies AG Digitale Geschichtswissenschaft (VHD) auch in diesem Jahr eine Veranstaltungsreihe zu digitalen Methoden und Tools rund um die historische Forschung an. Sie sind herzlich eingeladen, eine oder mehrere dieser Veranstaltungen wahrzunehmen. Das Programm bietet ein reiches Spektrum von Angeboten im Umgang mit qualitativen und quantitativen Methoden sowie zur Strukturierung, Bereinigung, Anreicherung und Publikation von Daten. Auf den Websites der AG Digitale Geschichtswissenschaft finden Sie allgemeine Hinweise und Beschreibungen zum Workshop-Programm. Diese führen Sie zu den jeweiligen individuellen Informationsangeboten der Workshop-Anbieter. Bitte beachten Sie, dass Aktualisierungen und Anmeldungsmöglichkeiten nur auf diesen letztgenannten Websites gegeben werden.

Mit herzlichen Grüßen, im Namen des Komitees der AG Digitale Geschichtswissenschaft
Katrin Moeller

[...]

Quelle: https://dhd-blog.org/?p=17699

digital history, Latent Dirichlet Allocation, Praxislabor, Praxislabor 2022, Python, Topic Modeling

Einführung in Topic Modeling mit Python

15. März 2022 Keine Kommentare

Melanie Althage, Martin Dröge, Professur für Digital History, Humboldt-Universität zu Berlin

Termin: Dienstag, 15.11.2022, 10:00-16:00 Uhr

Beschreibung:

Umfangreiche Textkopora inhaltlich strukturieren und auswerten ohne die Dokumente im Einzelnen gelesen zu haben – geht das? Das geht! Topic Modeling ist eine in den digitalen Geisteswissenschaften etablierte Methode, wenn es etwa darum geht, größere Textsammlungen inhaltlich-thematisch zu klassifizieren oder die Entwicklung von Publikationstrends und Diskursen nachzuvollziehen. Der Workshop bietet eine einsteigerfreundliche Einführung in ihre methodischen Grundlagen sowie die Implementierung mittels der Programmiersprache Python. Anhand eines konkreten Anwendungsfalls wird der Topic-Modeling-Workflow von der Vorbereitung der Textdaten bis zur Visualisierung und ersten Auswertung der Modellierungsergebnisse Schritt für Schritt durchgegangen.

[...]

Quelle: https://digigw.hypotheses.org/4090

Allgemein, Free Speech, Hate Speech, Machine Learning, NetzDG, Netzpolitik, netzwerkforschung, NLP, regulierung, Stellenanzeige, Stellenanzeigen, Textkorpora, Topic Modeling

Stellenausschreibung: Stud. Hilfskraft (m/w/d): Datenanalyse zum Diskurs über die Regulierung von digitaler Öffentlichkeit (Standort Leipzig), Bewerbungsfrist: 22.8.2021

10. August 2021 Keine Kommentare

Für ein Kooperationsprojekt der Universität Bremen und der Deutschen Nationalbibliothek (DNB) zum Diskurs über die Regulierung von digitaler Öffentlichkeit auf deutschen IT-Blogs und in den Printmedien suchen wir am Standort in Leipzig eine

studentische Hilfskraft.

Kernaufgabe ist die Unterstützung bei unserer Analyse unterschiedlicher digitaler Textkorpora. Hierfür sind Kenntnisse im Bereich natural language processing (NLP) und Erfahrungen im Umgang mit Python wichtige Voraussetzungen.

Aufgabenbeschreibung:
• Unterstützung bei der Analyse digitaler Textkorpora am Standort in Leipzig
• Aufbereitung der Daten für die Untersuchung mit verschiedenen Analysemethoden: Machine Learning Modelle, Topic Modelling, Netzwerkanalyse, Statistische Auswertung, Data Visualization.
• Inhaltliche Recherchen zu netzpolitischen Fragen

Wir bieten Ihnen:
• ein anregendes und inspirierendes Arbeitsumfeld
• die Gelegenheit an einer aktuellen und gesellschaftlich sehr relevanten Forschungsfrage mitzuarbeiten
• die Möglichkeit wissenschaftliche Fähigkeiten und Kompetenzen anzuwenden und zu vertiefen

Einstellungsvoraussetzungen:
• Möglichkeit 1x pro Woche an der DNB in Leipzig zu arbeiten.

[...]

Quelle: https://dhd-blog.org/?p=16355

Allgemein, CLARIAH-DE, Digitale Literaturwissenschaften, Quantitative Textanalyse, text mining, Topic Modeling, Workshop

Topic Modelling. Hands-on Training and Discussion Session – Berlin, 19.12.2019

9. Dezember 2019 Keine Kommentare

Am 19.12.2019 findet an der FU Berlin ein Workshop zum Thema Topic Modeling statt. Die Veranstaltung wird gemeinsam organisiert von DFG Exzellenzcluster Temporal Communities (Research Area 5, „Building Digital Communities“) und dem BMBF-geförderten Infrastrukturprojekt CLARIAH-DE.

Der halbtägige Workshop soll eine Einführung in das Thema Topic Modeling in den Literaturwissenschaften bieten. Auf eine theoretische Einführung in die Methodik wird eine Hands-On-Session folgen, in der die Teilnehmerinnen und Teilnehmer mit Hilfe eines einfach bedienbaren Tools lernen, selbst Topicmodelle aus Textsammlungen zu erstellen.

Im zweiten Teil des Workshops wird Prof. Katherine Bode Forschungsergebnisse präsentieren, die auf Topic Modeling basieren.

[...]

Quelle: https://dhd-blog.org/?p=12681

Forschungsdaten, Open Access, Topic Modeling, Veranstaltungen, Workshop

DH- Workshops in Tübingen: Publishing Data und Topic Modeling

10. Januar 2018 Keine Kommentare

Am 8. und 9. Februar veranstaltet der Lehrstuhl für Romanische Philologie der Universität Tübingen zwei Workshops zum Thema „Publishing Data using GitHub“ von José Calvo Tello und „Einführung in Topic Modeling“ von Ulrike Henny-Krahmer (beide Universität Würzburg).

Die Teilnehmeranzahl ist beschränkt, um Anmeldung wird bis zum 1. Februar gebeten, per mail an Frau Ehrt: monika.ehrt@uni-tuebingen.de

„Publishing Data using GitHub“ (8.

[...]

Quelle: http://dhd-blog.org/?p=8936

Allgemein, Forschung, Forschung (Methode), Quantitative Textanalyse, Stilometrie, Topic Modeling, Veranstaltungen

Textkomplexität als Stilmerkmal – Ein Veranstaltungsbericht

2. März 2016 Keine Kommentare

Was macht einen Roman „komplex“? Kann man die „Komplexität“ eines literarischen Textes messen, und ist Komplixität ein Merkmal, daß bestimmte Autoren, oder bestimmte Literaturgattungen von anderen unterscheidet?

Um diesen und ähnlichen Fragen nachzugehen fand am 07. und 08. Dezember 2015 am Lehrstuhl für Computerphilologie der Universität Würzburg der DARIAH-DE Expertenworkshop „Complexity Measures in Stylometry„ statt. Ziel der Veranstaltung war es, innerhalb der quantitativ arbeitenden Literaturwissenschaft eine Diskussion über das Thema „Textkomplexität“ anzuregen und in gemeinsamen Gesprächen auszuloten, welche Rolle Indikatoren der Textkomplexität in der Stilometrie spielen könnten. Dabei sollte zudem demonstriert werden, wie der in DARIAH-DE entwicklte DARIAH-DKPro-Wrapper dazu beitragen kann, die Berechnung solcher Indikatoren wesentlich zu vereinfachen.

Geladen waren Maciej Eder (Institute of Polish Studies, Pedagogical University of Krakow), Jeremi Ochab (Department of Theory of Complex Systems, Jagiellonian University, Krakow), Allan Riddell (Leslie Center for the Humanities, Dartmouth College) und Nils Reiter (Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart).

[...]

Quelle: http://dhd-blog.org/?p=6471

Allen Riddell, DARIAH-DE, Forschung (Methode), Inhaltsanalyse, Lehre und Ausbildung, Python, Textanalyse, Topic Modeling

TAToM, oder: Text Analysis with Topic Models (Tutorial)

31. März 2014 Keine Kommentare

Eine “topic heatmap” für die Tragödien von Jean Racine

Die Schulungsmaterialien “TAToM – Text Analysis with Topic Models for the Humanities and Social Sciences“, die von Allen Riddell im Rahmen von DARIAH-DE erstellt wurden, sind soeben erschienen.

Sie bestehen aus einer Serie von Tutorials, die grundlegende Verfahren der quantitativen Textanalyse abdecken. Sie thematisieren die Vorbereitung eines Textkorpus für die Analyse sowie die Exploration von Textsammlungen mit Verfahren wie Topic Modeling und Maschinellem Lernen. Besonderes Augenmerk liegt darauf, dass NutzerInnen weitestgehende Kontrolle über die Vorgänge der Textprozessierung behalten können. Wichtig war bei der Entwicklung der Materialien darüber hinaus, den Aspekt der Visualisierung von Topic Models mit in das Verfahren einzubeziehen.

Die Tutorials behandeln sowohl einige grundlegende als auch fortgeschrittene Themen und bauen in gewisser Weise auf den Materialien zu Python Programming for the Humanities von Folgert Kastorp und Maarten van Gompel auf bzw. setzen diese teilweise voraus. Die Tutorials nutzen in erster Linie die beliebte Skriptsprache Python, um mit den Textdaten umzugehen.

Die Inhalte in der Übersicht:
- Preliminaries & Getting started
- Working with text
- Preprocessing
- Feature selection: finding distinctive words
- Topic modeling with MALLET
- Topic modeling in Python
- Visualizing topic models
- Classification, Machine Learning, and Logistic Regression
- Case Study: Racine’s early and late tragedies

Die Tutorials wurden von Allen Riddell für DARIAH-DE verfasst und im März 2014 in Version 1.0 veröffentlicht. Die Koordination lag bei Christof Schöch am Lehrstuhl für Computerphilologie der Universität Würzburg. Rückmeldung zu den Tutorials ist immer willkommen, ebenso wie Hinweise auf Fehler. Bitte nutzen Sie hierfür den issue tracker auf GitHub. Die Tutorials werden unter der Lizenz Creative Commons Attribution 4.0 International zur Verfügung gestellt.

Quelle: http://dhd-blog.org/?p=3275