Fotis Jannidis – Planet Clio

Allgemein, CfP, CHR2023 ComputationalHumanities

CfP CHR 2023

11. April 2023 Keine Kommentare

CHR 2023, Paris, December 6-8

In the arts and humanities, the use of computational, statistical, and mathematical approaches has considerably increased in recent years. This research is characterized by the use of formal methods and the construction of explicit, computational models. This includes quantitative, statistical approaches, but also more generally computational methods for processing and analyzing data, as well as theoretical reflections on these approaches. Despite the undeniable growth of this research area, many scholars still struggle to find suitable research-oriented venues to present and publish computational work that does not lose sight of traditional modes of inquiry in the arts and humanities. This is the scholarly niche that the CHR conference aims to fill. More precisely, the conference aims at

Building a community of scholars working on humanities research questions relying on a wide range of computational and quantitative approaches to humanities data in all its forms. We consider this community to be complementary to the digital humanities landscape.
Promoting good practices through sharing “research stories”. Such good practices may include, for instance, the publication of code and data in order to support transparency and replication of studies; pre-registering research design to present theoretical justification, hypotheses, and proposed statistical analysis; or a redesign of the reviewing process for interdisciplinary studies that rely on computational approaches to answer questions relevant to the humanities.

[...]

Quelle: https://dhd-blog.org/?p=19273

Allgemein, Stellenausschreibung

Stellenausschreibung für DH-Professuren an der Northeastern University (USA)

16. März 2022 Keine Kommentare

Northeastern University is very excited to announce a new cluster hire in digital humanities, at the rank of Teaching Professor and Professor of the Practice. Please circulate widely! Details and application portal at https://northeastern.wd1.myworkdayjobs.com/en-US/careers/job/Boston-MA-Main-Campus/Open-Rank-Teaching-Professor-or-Professor-of-the-Practice-in-Digital-Humanities_R104028.

Please address nominations and inquiries about the position to Professor Julia Flanders, at j.flanders@northeastern.edu. Review of applications will begin on March 28 and will continue until the position is filled.

[...]

Quelle: https://dhd-blog.org/?p=17585

Allgemein, Call, Computational Literary Studies, Forschungsförderung, Schwerpunktprogramm

Schwerpunktprogramm „Computational Literary Studies“ (SPP 2207)

19. Oktober 2021 Keine Kommentare

Ausschreibung

Nr. 86, 15. Oktober 2021

Der Senat der Deutschen Forschungsgemeinschaft (DFG) hat im März 2018 die Einrichtung des Schwerpunktprogramms „Computational Literary Studies“ (SPP 2207) beschlossen. Als Laufzeit sind sechs Jahre vorgesehen. Die DFG lädt hiermit ein zur Antragstellung für die zweite dreijährige Förderperiode.

Mit „Computational Literary Studies“ bezeichnet man die quantitative und formale qualitative Analyse literarischer Texte. Das Schwerpunktprogramm zielt darauf, die weitere Entwicklung solcher datenzentrierten Forschungsansätze in den Literaturwissenschaften zu fördern. Folgende Forschungsschwerpunkte stehen im Fokus:

Innovative Verfahren für die computationelle Analyse literarischer Texte entwickeln oder

Quelle: https://dhd-blog.org/?p=16670

Allgemein, Forschung, Forschung (Methode), Konferenz, Veranstaltungen

CfP: “Digitale Literaturwissenschaft”

28. Oktober 2016 Keine Kommentare

Im Auftrag der Deutschen Forschungsgemeinschaft soll vom 9. bis 13. Oktober 2017 in der Villa Vigoni ein internationales literaturwissenschaftliches DFG-Symposion zum Thema „Digitale Literaturwissenschaft“ stattfinden. Es folgt organisatorisch dem Muster der Germanistischen Symposien der DFG, wie sie seit den 1970er Jahren durchgeführt wurden. Die Konferenzsprachen sind Englisch und Deutsch, wobei alle Teilnehmer in der Lage sein sollten, Beiträge in beiden Sprachen zu lesen und der Diskussion in beiden Sprachen zu folgen.

Medienwandel, Digitalisierung und Vernetzung haben in den letzten Jahren eine Reihe von Herausforderungen an die Literaturwissenschaften gestellt, die jedoch zugleich Entwicklungschancen sind. Erstens hat sich ihr Gegenstand, also das System Literatur mit Produktion, Distribution und Rezeption, teilweise verändert: Neue Literaturformen, z.B. der literarische Hypertext, sind hinzugekommen; neue Medienformen sind aufgetaucht, von denen zur Zeit noch nicht klar ist, ob sie Teil der Literaturwissenschaft bleiben oder nicht, z.

[...]

Quelle: http://dhd-blog.org/?p=7306

Allgemein

Versuch über Romangattungen 2. Teil

14. Oktober 2013 Keine Kommentare

Zur Erinnerung: Ziel meiner Überlegungen ist eine Liste mit deutschsprachigen Romangattungen zu erhalten. Der erste Schritt bestand darin, Komposita der Form x + roman aus den Unigrammen von Google-Books zu extrahieren. Im zweiten Schritt geht es nun darum, diese Liste mit Gattungsbezeichnungen der Form Adjektiv + Roman zu ergänzen, also ‘psychologischer Roman’, ‘philosophischer Roman’ usw. Quelle dafür sind diesmal die Bigramme von Google-Books, insgesamt 725 Dateien mit 388 GB Daten (komprimiert rd. 62 GB). Ergebnis des ersten Druchlaufs ist eine Liste, die auch viele Adjektive enthält, die keine Gattungen bezeichnen, z.B. ‘schöner Roman’, ‘englischer Roman’, ‘barocker Roman’. Eine manuelle Durchsicht reduziert das auf rd. 130 Gattungsbegriffe:

Wieder dominiert ein Begriff so sehr, dass man ihn besser aus der Liste löscht:

Der nächste Schritt besteht nun offensichtlich darin, die Liste mit den Komposita, die inzwischen auf rd. 385 Einträge eingedampft wurde, und diese zusammenzuwerfen, so dass man die rd. 500 Gattungsbezeichnungen auf einmal sichten kann:

Spätestens hier wird deutlich, warum es wichtig wäre, bei Untersuchungen dieser Art direkten Zugriff auf die Daten zu haben, die den Ngrammen zugrunde liegen, und warum das Arbeiten mit den Google-Ngrammen erfreulich und frustrierend zugleich ist. Ich kann hier nur vermuten, dass das Übergewicht des historischen Romans und des Kriminalromans dadurch zustandekommen, dass es sich dabei um Untertitel handelt. Entfernt man die beiden Begriffe und außerdem ‘Zeit-’ und ‘Bildungsroman’, kommt ein deutlich gleichförmigeres Feld zum Vorschein:

Die Begriffe lassen sich nach der Art ihrer Klassifikation unterscheiden. Für die 150 häufigsten Begriffe ergibt das diese Aufteilung der Gattungsbegriffe:

Handlungswelt/Thema: historischer – Zeit – Ritter – Gesellschafts – Staats – Zukunfts – utopischer – Kriegs – sozialer – psychologischer – höfischer – Gegenwarts – politischer – Heimat – Schäfer – Geschichts – Bauern – Exil – Sitten – Räuber – geschichtlicher – Spionage – Revolutions – phantastischer – Sozial – Großstadt – Adoleszenz – See – Agenten – Kolonial – Ehe – proletarischer – Arzt – Hirten – Generationen – sozialkritischer – Stadt – Universitäts – Dorf – Betriebs – Helden – heroischer – Berg – Produktions – Theater – erotischer – Märchen – Wende – religiöser – Indianer – christlicher – Industrie – Schul – Bewußtseins – Wildwest – sozialistischer – Geheimbund – Professoren – Widerstands – revolutionärer – Amerika – pornographischer – Hexen – Problem – exotischer – Raum – philosophischer – Ideen

Medium: Fortsetzungs – Prosa – Zeitungs – Kurz – Kolportage – Vers – Feuilleton – Heft – Illustrierten – Doppel – dramatischer – Foto – Experimental – experimenteller – Kunst – Heftchen – Groschen – Hintertreppen – Anti – Ich – Brief – Tagebuch – Dialog – Montage – Original – Arbeiter

Plotstruktur: Kriminal – Bildungs – Entwicklungs – Detektiv – Abenteuer – Liebes – Schelmen – Erziehungs – Künstler – Reise – pikaresker – galanter – biographischer – Abenteurer – Initiations – Erinnerungs – Desillusions – tragischer – Schicksals

Wirkung: Schauer – Unterhaltungs – satirischer – komischer – humoristischer – sentimentaler – Sensations – empfindsamer – Antikriegs – gesellschaftskritischer – Thesen – zeitkritischer

Realitätsbezug: autobiographischer – realistischer – Schlüssel – Tatsachen – Dokumentar – dokumentarischer – Reportage

Adressaten: Familien – Frauen – Jugend – bürgerlicher – Kinder – Volks – populärer – Populär

Wertung: Trivial – Tendenz – Schund – Mode – Kitsch – Epochen – Meister – Massen

In gewisser Weise ist damit die Arbeit erst einmal beendet: die Suche nach dem ‘System’ der deutschsprachigen Romangattungen hat ungefähr 500 Begriffe ans Licht gebracht. Leider sind 500 Kategorien für meine Zwecke viel zu viel. Will man brauchbare Einteilungen für das maschinelle Lernen haben, braucht man viele Beispiele für eine Kategorie, selbst bei 2000 Romanen wären das also eher 10 Kategorien als 100. Eine Lösung besteht könnte darin bestehen, eine Gruppe zu nehmen und die Genres unter Oberbegriffen zusammenzufassen. Es bietet sich an davor noch die beiden Gruppen ‘Handlungswelt/Thema’ und ‘Plotstruktur’, die ohnehin eng verwandt sind, zu einer zu vereinen und dann unter inhaltlichen Gesichtspunkten Oberbgriffe zu bilden. Da viele der Genres doch sehr epochenspezifisch sind oder sonstwie zeitlich gebunden, geht das nicht ohne eine gewisse Gewaltsamkeit:

Zeit und Gesellschaft: Zeit – Gesellschafts – Gegenwarts – Ehe – Generationen – Großstadt – Stadt – Heimat – Sitten – sozialer – Sozial – sozialkritischer – sozialistischer – Revolutions – Widerstands – revolutionärer Wende – Universitäts – Professoren – Dorf – Bauern – Betriebs – Produktions – proletarischer – Industrie – Schul – Theater – Kolonial – Hirten – Schäfer – Schelmen – pikaresker – Reise – Raum

Individuum und Entwicklung: Bildungs – Entwicklungs – Erziehungs – Künstler – Adoleszenz – biographischer – Schicksals – tragischer – Bewußtseins – psychologischer – Desillusions – Initiations – Erinnerungs

Populärer Unterhaltung: Zukunfts – Räuber – Spionage – phantastischer – utopischer – Wildwest – Kriminal – Detektiv – Abenteuer – Liebes – Indianer – Kriegs – Agenten – Arzt – erotischer – pornographischer – Geheimbund – Berg – galanter – Hexen – Märchen – exotischer – historischer – Ritter – Geschichts – geschichtlicher – See

Ideen: philosophischer – Ideen – Staats – politischer – utopischer – Problem

Religion: heroischer – Helden – religiöser – christlicher

Ob diese Einteilung sich in der analytischen Praxis bewährt, muss sich erst noch zeigen. Andere Vorschläge sind jederzeit willkommen.

PS: Genres nach Häufigkeit sortiert: Download der Gattungsbezeichnungen. [Edit: Die Daten können gerne nachgenutzt werden. Sie stehen unter einer Creative Commons By Lizenz]

PPS: Der utopische Roman kommt mit Absicht in zwei Kategorien vor.

Quelle: http://dhd-blog.org/?p=2384

Allgemein, Forschung, Forschung (Methode), Reflektion

Kleiner Versuch über Romangattungen

19. August 2013 Keine Kommentare

Ich arbeite an der Erstellung eines Romankorpus, das längere, deutschsprachige Erzähltexte von 1500 bis 1930 versammelt. Das Kernkorpus umfasst ca. 450 Romane, größtenteils deutschsprachige Originalromane, aber rd. 1/8 sind Übersetzungen, vor allem aus dem Englischen, Französischen und Russischen. Hinzu kommt ein größeres Korpus von zur Zeit rd. 1500 Texten (diese Zahl ist wirklich nur eine Schätzung, da die Texte noch zu sichten sind). Das Kernkorpus soll mit relativ ausführlichen Metadaten, etwa Druckort, Verlag, Originalsprache, Erzählform, Epoche und eben auch zur Gattung versehen werden. Die meisten dieser Angaben sind unproblematisch, Erzählform und Gattung sind es nicht. Schon die Kategorisierung eines längeren Prosatextes als Roman erweist sich als als andere als trivial, aber darum soll er hier nicht gehen. Sondern hier handelt es sich um die Frage nach Formen der Roman, nach den Gattungen der Gattung Roman.

Ein erster Lösungsversuch sah so aus: Da ich vermeiden wollte, dass die Gattungszuschreibungen ad hoc von mir vergeben werden, habe ich eine Hilfskraft beauftragt, aus einer Liste von Roman-Nachschlagewerken und Literaturgeschichten die Zuschreibungen herauszusuchen und ohne Vereinheitlichung zu notieren. Das Ergebnis war recht interessant (besten Dank Herr Weimer!). Da gab es Einträge wie „Briefroman::Künstler- und Liebesroman in Briefform::monologischer Briefroman“ (die Doppelpunkte trennen verschiedene Zuschreibungen) oder „Entwicklungsroman mit autobiographischen Zügen::Schelmenhafter Zeit- und Entwicklungsroman::Entwicklungs- und Zeitroman::Schelmenroman“ oder „Familienroman::moralisch-didaktischer Roman::Ich-Erzählung::Briefroman::aufklärerisch-bürgerlicher Roman“. Man kann dahinter ohne Probleme den Werther, den Simplizismus oder die Schwedische Gräfin erkennen.

Allerdings ist ein Begriff wie ‘monologischer Briefroman’ wohl keine Gattungsbezeichnung, vielmehr wird die Gattungsbezeichnung ‘Briefroman’ gemeinsam mit dem deskriptiven ‘monologisch’ zur Beschreibung verwendet. Viele der Begriffe scheinen eng verwandt zu sein, z.B. „Zeitroman::Gegenwartsroman::Gesellschaftsroman“. Dann finden sich Begriffe wie „Großroman“ oder „Altersroman“, die überhaupt keine Gattungsbegriffe im herkömmlichen Sinne sind, sondern lediglich klassifizieren und dabei manchmal auch bewerten. Leider zeigte sich außerdem, dass nur rd. 250 der Texte auf diese Weise beschrieben werden konnten; für die anderen 150 fanden sich in den Darstellungen keine Gattungsbezeichnungen.

Der nächste Schritt war die Vereinheitlichung der so zusammengetragenen Begriffe. Um für eine quantitative Auswertung brauchbar zu sein, geht es weniger um eine individualisierte Beschreibung des Einzelwerks, sondern um die Zuschreibung zu allgemeineren Kategorien, die es dann erlauben zu prüfen, ob man mit dieser Gruppe regelhaft Textmerkmale verbinden kann. Für diese Vereinheitlichung, aber auch für die Frage nach der Klassifizierung der übrigen 150 Texte wäre es nützlich auf eine existierende Systematik von Gattungsbegriffen zurückgreifen zu können. Die literaturwissenschaftliche Forschung scheint diese Frage bislang nicht systematisch verfolgt zu haben.

Eine erste Annäherung könnte über die Verwendung des Begriffs Roman in Zusammensetzungen geschehen. Dafür wäre eine Liste aller Komposita mit dem Wort ‘Roman’ ein guter Anfang. Die größte Menge an zugänglichen Sprachdaten bietet zur Zeit Google mit den Quellen für die N-Gramm-Suche. Für die Romankomposita habe ich die 1-grams verwendet (Version 20120701). Die Daten liegen in dieser Form vor: „Quasselbude_NOUN 1956 11 10“, wobei die Angabe der Wortklasse, die erst in der zweiten Version des Korpus hinzugekommen ist, nur teilweise vorliegt. Die erste Zahl bezeichnet das Jahr, die zweite die Anzahl der Vorkommen des Wortes und die dritte die Anzahl der Bände, in denen das Wort vorkommt.

Nach der Extraktion der Komposita, der Vereinfachung des Materials auf den Nominativ und einer manuellen Sichtung ergab dies eine Liste mit rd. 424 Einträgen vom „Alltagsroman“ über den „Haremsroman“ und den „Nichtroman“ bis zum „Zigeunerroman“. Zu jedem Begriff gibt es außerdem eine Frequenzangabe (Häufigkeit im ganzen Korpus). Die Zahl 424 ist cum grano salis zu nehmen, da man einige Einträge zusammenfassen konnte, z.B. „Debutroman“ und „Debütroman“ oder „Desillusionierungsroman“ und „Desillusionsroman“ oder sogar „Gegenwartroman“ und „Gegenwartsroman“.

Diese Liste ergibt keine Liste der Gattungsbezeichnungen und trotz ihrer Länge schon gar nicht eine vollständige. Einige der Begriffe sind keine Gattungsbezeichnungen, wenn man darunter „die als ge- und bewußte Normen die Produktion und Rezeption von Texten bestimmenden ‘historischen Textgruppen’“ versteht (Klaus Hempfer: „Gattung“ in: Klaus Weimar (Hg.): Reallexikon der deutschen Literaturwissenschaft Bd. 1, de Gruyter 1997, S. 651 ), sondern haben eine andere Funktion, z.B. „Debütroman“,“Emigrationsroman“,“Hauptroman“ oder „Lieblingsroman“. Einige beziehen sich außerdem auf einen einzigen Text (z.B. „Rosenroman“ oder „Josephsroman“). Die Liste enthält also Begriffe, die keine Gattungsnamen sind und andererseits gibt es noch mehr Bezeichnungen für Gattungen, die aber nicht als Kompositum aufgebaut sind, nämlich in der Verbindung von ADJ + NOUN, also z.B. „sozialer Roman“, „psychologischer Roman“, „philosophischer Roman“ usw. Diese sind in der ersten Fassung der Liste nicht enthalten.

Mit wenig Aufwand kann man aus den Daten, die ja die Verwendungshäufigkeit der Begriffe enthalten, ein Wordle erstellen, indem man einen Text generiert, der die Begriffe anteilig zu ihrer absoluten Häufigkeit enthält. Das Ergebnis sieht so aus:

Leider ist ‘Kriminalroman’ so dominant, dass die anderen Begriffe sehr schnell in unlesbarer Kleinschreibung verschwinden. Wenn wir ihn aus dem Bild entfernen, ergibt sich diese informationsreichere Übersicht:

Das ist hübsch. Und es ist ein erster Schritt auf dem Weg eines Überblicks über die Gattungsbegriffe für den Roman. Aber natürlich hat es nur einen eingeschränkten analytischen Wert. Die Ursachen für die hohe Frequenz eines Worts können sehr unterschiedlich sein. Die große Häufigkeit des ‘Kriminalromans’ etwa ergibt sich daraus, dass dies eine eingeführte paratextuelle Bezeichnung ist, die sich im Text findet (Meinem Wissensstand nach sind Titel und Untertitel Teil des Korpus). Der ‘Bildungsroman’ dagegen ist ein Begriff der Beschreibungssprache. Interessant sind Begriffe wie ‘Zeitroman’, die sich am Anfang des 20. Jahrhunderts in einer ganzen Reihe von Romantiteln finden, während er gegen Ende des Jahrhunderts häufiger in Texten über Romane zu finden ist.

Anders ausgedrückt: Die Analyse hat einen ersten Eindruck von der Häufigkeitsverteilung von Gattungsbegriffen ergeben, aber wir können nicht beurteilen, ob es sich hierbei um Begriffe der Objekt- oder Metasprache handelt. Das Problem könnte man möglicherweise lösen, wenn man in einem großen Bibliothekskatalog die Untertitel von Romanen systematisch unter der Perspektive auswertet, welche der hier aufgeführten Kategorien vorkommen. Das würde dann ihre Verwendung in der Objektsprache belegen. Außerdem könnte man, ausgehend von den Publikationsdaten der Romane überprüfen, ob ungefähr gleichzeitig die entsprechenden Begriffe geläufig sind, also Romanmetadaten und Ngramm-Daten abgleichen.

Ein weiteres Problem entsteht durch die Heterogenität der Gattungsbegriffe. Selbst wenn man die Begriffe aussondert, die offensichtlich keine Gattungen bezeichnen, bleibt eine Fülle von Begriffen übrig, die sich auf sehr unterschiedliche Aspekte beziehen, z.B. der inhaltsbezogene Begriff Abenteuerroman und der referenzbezogene Begriff Schlüsselroman. In dieser Form sind sie nur eingeschränkt tauglich für die Korrelierung mit den Ergebnissen von Clustering aufgrund von Textmerkmalen. Dieses Problem könnte durch eine genauere Analyse der Gattungsbegriffe gelöst oder zumindest mal aufgeräumt werden. Und wenn wir schon bei Zukunftsplänen sind: Die historische Information, wann welche Gattungsbegriffe häufiger zu finden sind, könnte man auch noch auswerten, aber das ist nicht ganz einfach zu visualisieren. So etwas ist noch zu unübersichtlich:

(Link)

Insgesamt also noch ein weiter Weg zu einem brauchbaren Beschreibungssystem von Romangattungen, aber die Frequenzangaben helfen wohl bereits bei der Vereinfachung der vorliegenden Begriffe. Nun müssten noch die 150 anderen Texte zugeordnet werden. Hat jemand Evremont von Sophie Bernhardi gelesen und hätte einen Vorschlag zur Gattungszuordnung? Oder Bruno Willes Glasberg. Henriette von Paalzows Ste. Roche?

Quelle: http://dhd-blog.org/?p=2128