Erfolg und Emergenz in den Digital Humanities – ein Tagungseindrucksausschnitt

von Fabian Cremer, Max-Planck-Institut zur Erfoschung multireligiöser und multiethnischer Gesellschaften

Es könnte durchaus aufhorchen lassen, mit welcher Selbstverständlichkeit ökonomische Kategorien zur Beschreibung oder Beurteilung wissenschaftlicher Vorhaben herangezogen werden, trotz der weit verbreiteten Kenntnis des Drucks [1], dem die drittmittelgeprägten Digital Humanities als Beutegemeinschaft ausgesetzt sind. Im gleichnamigen Panel der DHd 2014 [2] hängt der expliziten Frage nach dem „Mehrwert“ der Informationstechnologie in geisteswissenschaftlichen Projekten, implizit auch das Legitimationsbedürfnis einer Disziplin an, die neben ihrem Selbstverständnis auch ihre Förderwürdigkeit aus den Innovationsmomenten zieht, die in dieser Verbindung von Geisteswissenschaft und Informatik mitunter stecken. Die Entstehung des Mehrwerts lässt sich aus der Marxschen Theorie des Kapitalismus [3] auf die stärker erkenntnisgewinnorientierte Aspekte der Wissenschaft übertragen: Mit dem den Einsatz von Informationstechnologien im Arbeitsprozess der GeisteswissenschaftlerInnen entsteht ein Produkt, dessen Gegenwert über den der jeweils aufgebrachten Arbeitsleistung hinausgeht, ein wissenschaftliches Surplus. Von diesen emergenten Eigenschaften der wissenschaftlichen und personellen Verbindungen in den Digital Humanities zeugen die drei Erfolgsgeschichten, die in der Mehrwertsession erzählt wurden.

Das Forschungsgebiet kunsthistorisch motivierter Analyse von Musikvideos, in dem sich Thorsten Wübbena kunsthistorisch und Matthias Arnold informationstechnologisch bewegen [4], zeigt idealtypisch, welche Möglichkeiten sich nach dem Fall analoger Barrieren ergeben. Genuin digitale oder im Analogen nur schwer wissenschaftlich rezipierbare Medien wie Musikvideos, ergeben sich der Analyse ihres komplexen und in Bewegung befindlichen Bezugssystems aus Text, Bild und Musik in einer webbasierten Arbeitsumgebung zur Videoannotation [5] nicht nur leichtgängiger sondern auch nachhaltiger. Ohne Medienbrüche direkt im Material arbeiten zu können, erlaubt außerdem nicht nur bessere Analysebedingungen, sondern eröffnet in der wissenschaftlichen Kommunikation den Diskurspartnern auch einen anderen Zugriff auf die eigene Argumentationsgrundlage, die visuelle Materialerschließung in der digitalen Arbeitsumgebung. Der bisher unvermeidliche Umweg über den Text, die Abstraktion über die Verschriftlichung, wird vermieden.

Im Untersuchungsfeld der Wanderungsbewegungen von Musikern im 16. Und 17. Jahrhundert lässt sich anhand der Projektfolge Musici-Musmig [6] eines der Phänomene der Digital Humanities exemplarisch verfolgen, der Fokuswechsel von einer im Umfang beschränkten aber tiefgehenden Erschließung zu einer räumlich und thematisch breiteren Datenbasis mit reduzierterem Detailgrad und generalisierenden Ordnungsstrukturen. Neben der Notwendigkeit, sich dabei mit informationstechnologischen Methoden der Aufbereitung von Daten, ihrer Maschinenlesbarkeit und Modellierung auseinanderzusetzen (und dann davon zu profitieren), erschloss sich die hilfreiche Wirkung der Technologien im gemeinsamen Vortag von Berthold Over und Torsten Roeder ganz unmittelbar in den im Projekt eingesetzten Visualisierungsstrategien mit Karten und Bewegungsmustern, denn die Komplexität der untersuchten Phänomene, die Netzwerke und Dynamik von Personen, Orte, Zeiträume, Ereignissen und Beziehungen, ist in der linearen Struktur von Text und Sprache weit schwerer erfahrbar.

Die lineare Struktur von Text und ihre Formalisierbarkeit machen sich hingegen Christian Riepl und die Sprachwissenschaft zu Nutze. Der transkribierte und morphologisch und morphosyntaktisch ausgezeichnete hebräische Text des Alten Testamentes war in den letzten 30 Jahren kontinuierlich Gegenstand sprachwissenschaftlicher Fragestellungen, unter dem Kontrastmittel heutiger Dreijahresforschung eine Ewigkeit. An der Geschichte der „Biblia Hebraica transcripta“ [7] lassen sich zahlreiche Lehren für die Digital Humanities ziehen, die hier nur pointierter Form erscheinen können: Eine langfristige und dauerhafte Auseinandersetzung ist keine wissenschaftliche und technologische Innovationsbremse. Geisteswissenschaft kann in der Auseinandersetzung mit der Stukturliebe und formalisierten Denkweise der Informatik auch methodisch profitieren. Erhalt und stetige Erweiterung und Anreicherung digitaler Datenbestände sind der Schlüssel für die Pluralität und Kontinuität ihrer Nutzung. Dialogische Prinzipien in der Interaktion von Mensch und Maschine sorgen dafür, dass die Geisteswissenschaft weder in die Sklaverei formalisierter Regelwerke der Technik getrieben wird, noch in den Grenzen menschlicher Erfassungsvermögens gefangen bleibt.

Neben dem im Call der Konferenz geforderten „analytischen Mehrwert“ boten die drei Projektvorstellungen inspirierende Auseinandersetzungen mit Problemen, die sie ohne die beteiligten Computer sicher nicht gehabt hätten.

 

[1] http://www.dfg.de/foerderung/grundlagen_rahmenbedingungen/drittmitteldruck/

[2] DHd 2014. Digital Humanities – methodischer Brückenschlag oder “feindliche Übernahme”? Chancen und Risiken der Begegnung zwischen Geisteswissenschaften und Informatik, 1. Jahrestagung der Digital Humanities im deutschsprachigen Raum, 25.-28. März 2014, Universität Passau, http://www.dhd2014.uni-passau.de/

[3] Karl Marx: Das Kapital. Buch I: Der Produktionsprocess des Kapitals. Hamburg, 1867, S. 112, http://www.deutschestextarchiv.de/marx_kapital01_1867/131

[4] Portable Musicvideos: http://www.portablemvs.net; Thorsten Wübbena: http://d-nb.info/gnd/123312396, http://www.kunst.uni-frankfurt.de/de/mitarbeiter/seiten/thorsten-wuebbena/zur-person/; Matthias Arnold: http://www.asia-europe.uni-heidelberg.de/en/people/person/persdetail/arnold.html

[5] http://pan.do/ra

[6] Europäische Musiker in Venedig, Rom und Neapel (1650-1750): Musik, Identität der Nationen und kultureller Austausch: http://www.musici.eu; Music migrations in the early modern age: the meeting of the European East, West and South: http://musmig.hypotheses.org/; Berthold Over: http://d-nb.info/gnd/135197848, http://www.musikwissenschaft.uni-mainz.de/musikwissenschaft/personen/over.htm; Torsten Roeder: http://www.bbaw.de/die-akademie/mitarbeiter/roeder

[7] Biblia Hebraica transcripta – Forschungsdatenbank 3.0: http://www.bht.gwi.uni-muenchen.de/; Christian Riepl: http://d-nb.info/gnd/135197848, http://www.itg.uni-muenchen.de/personen/riepl_christian/index.html

Quelle: http://dhd-blog.org/?p=3268

Weiterlesen

Coding Da Vinci – Hackathon mit offenen Kulturdaten

In Berlin findet zum ersten Mal ein Hackathon mit http://daten.berlin.de/sites/default/files/styles/landscape/public/field/image/coding_davinci.png?itok=5AFtRl9Boffenen Daten aus verschiedenen Kultureinrichtungen statt. Der erste Kultur-Hackathon wird gemeinsam ausgerichtet von der Deutschen Digitalen Bibliothek, der Servicestelle Digitalisierung Berlin, der Open Knowledge Foundation Deutschland und Wikimedia Deutschland.

Die Daten kommen u.a. von folgenden Institutionen, die Datensätze werden ab 1. April 2014 unter http://codingdavinci.de/daten/ veröffentlicht:

  • Deutsche Digitale Bibliothek
  • Zentral- und Landesbibliothek Berlin
    • Adressbucheinträge des Jüdischen Adressbuchs von Groß-Berlin von 1931
    • Berliner Adressbuchdaten (1799-1943)
    • Daten des NS-Raubgut-Projekts
  • Ethnologisches Museum Berlin
    • Tagore-Sammlungsobjekte als CT-Daten, 3D-Modelle (Musikinstrumente Südasiens)
    • Bestimmung von Musikinstrumenten (Metadaten, Audio-, Videofiles)
  • Max-Plack-Institut für Wissenschaftsgeschichte
    • bibliografische Metadaten zur Rara-Sammlung (historischer Buchquellen vom 16.-19. Jhd.)
    • Metadaten zu Filmen aus der MPWG-Mediathek
  • Stadtmuseum Berlin
    • Stadtansichten mit Grafiken und Gemälde von Berlin im 18. und 19.Jhd.
    • Heinrich Zille zeichnet die Berliner Bevölkerung und die sozialen Verhältnisse in typischer “Berliner Schnauze” (Grafische Sammlung)
    • Nachlass des Berliner Fotografen Harry Croner, darunter Fotos der Berliner Filmfestspiele, Theaterfotografien, 1945 – 1988
  • Berlinische Galerie
    • Aufnahmen aus dem Ostberliner Fotoarchiv 1960-1970
  • Museum für Naturkunde Berlin
    • Analyse von Gigapixel-Scans von Insektenkästen
  • Ihre Daten?

Termine:

  • 26./27. April 2014
  • 5./6. Juli 2014 (mit Preisverleihung)
  • dazwischen 10 Wochen eigenständiger Sprint

Ort: Wikimedia Deutschland e.V. | Tempelhofer Ufer 23-24 | 10963 Berlin

Teilnehmen:

  • Kulturinstitutionen können Ihre Daten zur Verfügung stellen, sofern die Datensätze unter einer offenen Lizenz zur Verfügung stehen. Kontakt: Helene Hahn (OKF)
  • Kultur- und Technikinteressierte, auch und besonders die, die nicht coden können aber interessante Ideen haben, sind eingeladen, am Hackathon teilzunehmen.
  • Reisestipendien werden einige wenige vergeben, mehr Informationen unter http://codingdavinci.de/info/

Weitere Informationen:

 

Quelle: http://dhd-blog.org/?p=3214

Weiterlesen

Neuerscheinung: Literaturwissenschaft im digitalen Medienwandel

Im September 2012 fand in Leipzig im Rahmen des 8. Kongresses des Frankoromanistenverbands eine Sektion zum Thema  “Revoluton der Medien, Evolution der Literaturwissenschaft?” statt, die von Christof Schöch (Lehrstuhl für Computerphilologie, Univ. Würzburg) und Lars Schneider (Institut für Romanistik, LMU München) geleitet wurde.

Edition "Moralische Wochenschriften": Analyseansicht mit hervorgehobenen Personen, Orten und Werken.
Edition “Moralische Wochenschriften”: Analyseansicht mit hervorgehobenen Personen, Orten und Werken. (Aus dem Beitrag von Martina Semlak)

Die Beiträge dieser Sektion sind nun als Beiheft 7 zu Philologie im Netz (PhiN) unter dem Titel Literaturwissenschaft im digitalen Medienwandel erschienen. Der Sammelband fragt nach konkreten Impulsen, die der gegenwärtige Medienwandel den Literaturwissenschaften verleiht. Sein Vorgehen ist vor allem pragmatischer Natur: Die Beiträge widmen sich der Erschließung von Forschungsgegenständen bei der digitalen Textedition, ihrer Analyse mit Hilfe quantitativer Verfahren der Textanalyse, bei der sowohl technische als auch menschliche Syntheseleistungen entscheidend sind, sowie der Dissemination von Forschungsergebnissen und neuen Formen des Zusammenarbeitens.

Die Beiträge erscheinen im Open Access (CC-BY) und sind teils auf Deutsch, teils auf Französisch verfasst.

Inhaltsverzeichnis

  • Lars Schneider & Christof Schöch: Literaturwissenschaft im digitalen Medienwandel: Einleitung
  • Klaus-Dieter Ertler: Die Gattung der frankophonen “Spectators” im Spiegel der zeitgenössischen Medienrevolution
  • Martina Semlak: Digitale Edition als Instrument für literaturwissenschaftliche Forschung
  • Anne Baillot: Les corpus français sont-ils allemands? Éditer des textes de la Prusse frédéricienne en Allemagne
  • Delphine Dufour: L’enjeu numérique dans l’édition de la correspondance de Marceline Desbordes-Valmore
  • Isabel Rio Novo & Célia Vieira: e-Poeticae – Textes de théorisation littéraire en ligne
  • Glenn Roe: L’étude littéraire à l’ère du numérique : du texte à l’intertexte dans les “digital humanities”
  • Anne-Sophie Bories: Taratantara : la mémoire et l’oubli du décasyllabe dans la poésie de Raymond Queneau
  • Christof Schöch: Corneille, Molière et les autres. Stilometrische Analysen zu Autorschaft und Gattungszugehörigkeit im französischen Theater der Klassik
  • Lilian Landes: Flexibel, fluide, filternd. Weshalb die Geisteswissenschaften stärker von der Netzkultur profitieren sollten
  • Annette Keilhauer: Perspectives des études genre à l’ère de la numérisation
  • Thomas Stöber: Der “digitale Schreibtisch”: Innovationsmanagement und Vernetzung für das wissenschaftliche Arbeiten
  • Jörg Dünne: Das Jules Verne-Projekt – Alternative Heuristiken literaturwissenschaftlicher Forschung

Quelle: http://dhd-blog.org/?p=3196

Weiterlesen

TaDiRAH – Taxonomy of Digital Research Activities in the Humanities

von Luise Borek, Technische Universität Darmstadt

Die Taxonomy of Digital Research Activities in the Humanities (TaDiRAH) ist ein gemeinsames Projekt von DARIAH-DE und DiRT, das eine praxisorientierte Taxonomie für Ziele und Methoden digitaler geisteswissenschaftlicher Forschungsziele und –methoden zum Ziel hat. Sie richtet sich an digital arbeitende Forscherinnen und Forscher, deren Untersuchungsgegenstände einen strukturierten Zugang erfordern. Gleichzeitig möchte sie damit einen Beitrag für eine weite Sichtbarkeit und Vernetzung von DH-Projekten im Speziellen – und der Digital Humanities im Allgemeinen leisten.

Nach einem einjährigen Entstehungsprozess, während dem die Taxonomie von dem großen Interesse und konstruktivem Feedback der DH-Community profitieren konnte, steht TaDiRAH nun als Version 0.5 auf GitHub zur Verfügung. Es handelt sich dabei keineswegs um eine abgeschlossene Taxonomie – die Versionierung 0.5 und die als offen angelegten Listen der Objekte und Techniken bezeugen dies – vielmehr ist nun eine Phase erreicht, in der ihr praktischer Nutzen in den heterogenen Anwendungsbereichen der Community erprobt und weiter verbessert werden soll.

Aktuell wird TaDiRAH in verschiedenen Kontexten implementiert, darunter die Zotero-Bibliografie Doing Digital Humanities von DARIAH-DE, das Tool-Verzeichnis der Digital Research Tools (DiRT) sowie die Projektstruktur von DHCommons.

Eine Version in maschinenlesbaren Formaten wird folgen.

Quelle: http://dhd-blog.org/?p=3073

Weiterlesen

Evolution der Informationsinfrastruktur – Kooperation zwischen Bibliothek und Wissenschaft

Festschrift FEZum zehnjährigen Bestehen der Abteilung Forschung und Entwicklung (F&E) der Niedersächsischen Staats- und Universitätsbibliothek Göttingen ist ein Sammelband mit dem Titel “Evolution der Informationsinfrastruktur – Kooperation zwischen Bibliothek und Wissenschaft” erschienen. Das Werk resümiert entlang ausgewählter Meilensteine die Arbeit im vergangenen Jahrzehnt. Dabei begibt es sich auf die Spuren des Wandels im Leitbild wissenschaftlicher Bibliotheken. Der Sammelband wird herausgegeben von Dr. Heike Neuroth, Prof. Dr. Norbert Lossau und Prof. Dr. Andrea Rapp.

Gemeinsam mit Partnern aus der Wissenschaft wurden zahlreiche, wegweisende Projekte auf dem Gebiet der digitalen Forschung vorangebracht. Dieser Pionierarbeit in der deutschen Bibliothekslandschaft wird in 19 Aufsätzen von über 30 Autorinnen und Autoren nachgegangen.

Das Buch ist beim vwh-Verlag in Kooperation mit dem Universitätsverlag Göttingen erschienen. Sie können die digitale Open Access-Fassung für nicht-kommerzielle Zwecke hier herunterladen: http://dx.doi.org/10.3249/webdoc-39006.

Eine gedruckte Fassung des Buches kann beim vwh-Verlag für 24,90€ bestellt werden.

Eine Dokumentationsseite zur Tagung anlässlich des zehnjährigen Bestehens der Abteilung F&E ist unter diesem Link verfügbar.

ISBN:  978-3-86488-043-8                            DOI-URL: http://dx.doi.org/10.3249/webdoc-39006

Quelle: http://dhd-blog.org/?p=3012

Weiterlesen

DARIAH-DE Workshop “Introduction to the TXM Content Analysis Platform”

The Department for Literary Computing, Würzburg University, will organize a DARIAH-DE Workshop called “Introduction to the TXM Content Analysis Platform”.

Workshop outline

The objective of the “Introduction to TXM” tutorial is to introduce the participants to the methodology of text analysis through working with the TXM software directly on their own laptop computers. At the end of the tutorial, the participants will be able to input their own textual corpora (Unicode encoded raw texts or XML/TEI tagged texts) into TXM and to analyze them with the panel of content analysis tools available: word patterns frequency lists, kwic concordances and text browsing, rich full text search engine syntax (allowing to express various sequences of word forms, part of speech and lemma combinations constrained by XML structures), statistically specific sub-corpus vocabulary analysis, statistical collocation analysis, etc.). The portal version of TXM, allowing the on line access and analysis of corpora, will also be introduced.

Basic information

  • Time: February 6-7, 2014
  • Place: Würzburg University (details tba)
  • Workshop leader: Serge Heiden (Lyon)
  • Local organizer: Christof Schöch (Würzburg)

For further information:

Practical matters

The workshop is aimed at younger as well as experienced scholars from the humanities dealing with textual data. It is being organized by the Department for Literary Computing at Würzburg University, Germany, under the auspices of the DARIAH-DE initiative. It will be held by Serge Heiden, leader of the TXM project. It will take place on Feb. 6-7, 2014 at Würzburg University.

The maximum number of participants is limited to 15 and places will be filled on a first-come first-serve basis. The deadline for applications is January 20th, 2014. There is no fee for participating in this event. You will need to bring along your own laptop computer. Access to the internet will be available. Please contact Dr. Christof Schöch for further details and to sign up for the event at christof.schoech@uni-wuerzburg.de.

Preliminary programme

Thursday, February 6

  • 13:30-14:00 – Welcome
  • 14:00-15:30 – Introduction to TXM
  • 15:30-16:00 – Coffee break
  • 16:00-17:30 – Hands-on Session 1
  • 18:00-19:15 – Lecture by invited speaker (tba)
  • 20:00- – Dinner

Friday, Feb 7

  • 9:00-11:00 – Hands-on Session 2
  • 11:00-11:30 – Coffee break
  • 11:30-13:00 – Hands-on Session 3
  • 13:00-13:30 – Final discussion and farewell

Note: This event is being organized by DARIAH-DE with funding provided by the German Federal Ministry of Education and Research (BMBF) under the identifier 01UG1110J.

Quelle: http://dhd-blog.org/?p=2782

Weiterlesen

Europeana Cloud Bericht “Digital research practices, tools and scholarly content use”

Das Projekt Europeana Cloud: Unlocking Europe’s Research via The Cloud hat heute seinen Bericht zu digitalen Forschungsmethoden und Werkzeugen sowie dem wissenschaftlichem Umgang mit Inhalten in den Geistes- und Sozialwissenschaften veröffentlicht.

Die Analyse zeigt in drei aufeinander folgenden Kapiteln jeweils den aktuellen Stand zu den Themen digitaler Content (Bilder, Text, Video und Ton), digitale Methoden (z.B. Recherche, Verwalten von Inhalten, kollaboratives Arbeiten) und digitale Tools (z.B. Definition, Visualisierung) in den jeweiligen Fachcommunities.

Sie dient zudem als Grundlage für eine von Europeana Cloud durchgeführte online-Umfrage in den Communities, die derzeit ausgewertet wird.

Quelle: http://dhd-blog.org/?p=2612

Weiterlesen

Uni Oslo: Blinde Studenten nutzen die Digitale Bibliothek im TextGrid Repository

Erfreuliche Nachrichten aus Norwegen: Am FB Deutsche Sprache und Literatur der Universität Oslo (ILOS / Institutt for litteratur, områdestudier og europeiske språk) nutzen blinde und sehbehinderte GermanistikstudentInnen die Digitale Bibliothek im TextGrid Repository erfolgreich als Studienquelle für literarische Primärtexte. Das berichtet uns Christian Janss, Editionsphilologe und Dozent für Deutsche Sprache und Literatur der dortigen Humanistischen Fakultät. Eine große Arbeitserleichterung für alle Beteiligten: Üblicherweise wird mühsam (und mit dem bekannt wechselhaften Erfolg) aus Printausgaben gescannt, anschließend via OCR in durchsuchbares Textformat umgewandelt; mehrere Korrekturgänge inbegriffen. Ein aufwendiges, zeitintensives Verfahren.

Demgegenüber lesen die norwegischen StudentInnen die Texte aus der Digitalen Bibliothek im TextGrid Repository direkt per Braillezeile aus. Scannen, OCR und Korrekturlesen entfallen, ebenso wie das mühsame Zusammensuchen verläßlicher Quellen im Internet; mit dem TextGrid Repository macht eine einzige URL eine große Anzahl verläßlicher, zitierfähiger und durchsuchbarer Primärtexte zugänglich.

Ein toller Anwendungsfall, den wir TextGridler bislang nicht bedacht haben!

220px-Refreshable_Braille_display
Braillezeile

 

Quelle: http://dhd-blog.org/?p=2215

Weiterlesen

Kleiner Versuch über Romangattungen

Ich arbeite an der Erstellung eines Romankorpus, das längere, deutschsprachige Erzähltexte von 1500 bis 1930 versammelt. Das Kernkorpus umfasst ca. 450 Romane, größtenteils deutschsprachige Originalromane, aber rd. 1/8 sind Übersetzungen, vor allem aus dem Englischen, Französischen und Russischen. Hinzu kommt ein größeres Korpus von zur Zeit rd. 1500 Texten (diese Zahl ist wirklich nur eine Schätzung, da die Texte noch zu sichten sind). Das Kernkorpus soll mit relativ ausführlichen Metadaten, etwa Druckort, Verlag, Originalsprache, Erzählform, Epoche und eben auch zur Gattung versehen werden. Die meisten dieser Angaben sind unproblematisch, Erzählform und Gattung sind es nicht. Schon die Kategorisierung eines längeren Prosatextes als Roman erweist sich als als andere als trivial, aber darum soll er hier nicht gehen. Sondern hier handelt es sich um die Frage nach Formen der Roman, nach den Gattungen der Gattung Roman.

Ein erster Lösungsversuch sah so aus: Da ich vermeiden wollte, dass die Gattungszuschreibungen ad hoc von mir vergeben werden, habe ich eine Hilfskraft beauftragt, aus einer Liste von Roman-Nachschlagewerken und Literaturgeschichten die Zuschreibungen herauszusuchen und ohne Vereinheitlichung zu notieren. Das Ergebnis war recht interessant (besten Dank Herr Weimer!). Da gab es Einträge wie „Briefroman::Künstler- und Liebesroman in Briefform::monologischer Briefroman“ (die Doppelpunkte trennen verschiedene Zuschreibungen) oder „Entwicklungsroman mit autobiographischen Zügen::Schelmenhafter Zeit- und Entwicklungsroman::Entwicklungs- und Zeitroman::Schelmenroman“ oder „Familienroman::moralisch-didaktischer Roman::Ich-Erzählung::Briefroman::aufklärerisch-bürgerlicher Roman“. Man kann dahinter ohne Probleme den Werther, den Simplizismus oder die Schwedische Gräfin erkennen.

Allerdings ist ein Begriff wie ‘monologischer Briefroman’ wohl keine Gattungsbezeichnung, vielmehr wird die Gattungsbezeichnung ‘Briefroman’ gemeinsam mit dem deskriptiven ‘monologisch’ zur Beschreibung verwendet. Viele der Begriffe scheinen eng verwandt zu sein, z.B. „Zeitroman::Gegenwartsroman::Gesellschaftsroman“. Dann finden sich Begriffe wie „Großroman“ oder „Altersroman“, die überhaupt keine Gattungsbegriffe im herkömmlichen Sinne sind, sondern lediglich klassifizieren und dabei manchmal auch bewerten. Leider zeigte sich außerdem, dass nur rd. 250 der Texte auf diese Weise beschrieben werden konnten; für die anderen 150 fanden sich in den Darstellungen keine Gattungsbezeichnungen.

Der nächste Schritt war die Vereinheitlichung der so zusammengetragenen Begriffe. Um für eine quantitative Auswertung brauchbar zu sein, geht es weniger um eine individualisierte Beschreibung des Einzelwerks, sondern um die Zuschreibung zu allgemeineren Kategorien, die es dann erlauben zu prüfen, ob man mit dieser Gruppe regelhaft Textmerkmale verbinden kann. Für diese Vereinheitlichung, aber auch für die Frage nach der Klassifizierung der übrigen 150 Texte wäre es nützlich auf eine existierende Systematik von Gattungsbegriffen zurückgreifen zu können. Die literaturwissenschaftliche Forschung scheint diese Frage bislang nicht systematisch verfolgt zu haben.

Eine erste Annäherung könnte über die Verwendung des Begriffs Roman in Zusammensetzungen geschehen. Dafür wäre eine Liste aller Komposita mit dem Wort ‘Roman’ ein guter Anfang. Die größte Menge an zugänglichen Sprachdaten bietet zur Zeit Google mit den Quellen für die N-Gramm-Suche. Für die Romankomposita habe ich die 1-grams verwendet (Version 20120701). Die Daten liegen in dieser Form vor: „Quasselbude_NOUN 1956 11 10“, wobei die Angabe der Wortklasse, die erst in der zweiten Version des Korpus hinzugekommen ist, nur teilweise vorliegt. Die erste Zahl bezeichnet das Jahr, die zweite die Anzahl der Vorkommen des Wortes und die dritte die Anzahl der Bände, in denen das Wort vorkommt.

Nach der Extraktion der Komposita, der Vereinfachung des Materials auf den Nominativ und einer manuellen Sichtung ergab dies eine Liste mit rd. 424 Einträgen vom „Alltagsroman“ über den „Haremsroman“ und den „Nichtroman“ bis zum „Zigeunerroman“. Zu jedem Begriff gibt es außerdem eine Frequenzangabe (Häufigkeit im ganzen Korpus). Die Zahl 424 ist cum grano salis zu nehmen, da man einige Einträge zusammenfassen konnte, z.B. „Debutroman“ und „Debütroman“ oder „Desillusionierungsroman“ und „Desillusionsroman“ oder sogar „Gegenwartroman“ und „Gegenwartsroman“.

Diese Liste ergibt keine Liste der Gattungsbezeichnungen und trotz ihrer Länge schon gar nicht eine vollständige. Einige der Begriffe sind keine Gattungsbezeichnungen, wenn man darunter „die als ge- und bewußte Normen die Produktion und Rezeption von Texten bestimmenden ‘historischen Textgruppen’“ versteht (Klaus Hempfer: „Gattung“ in: Klaus Weimar (Hg.): Reallexikon der deutschen Literaturwissenschaft Bd. 1, de Gruyter 1997, S. 651 ), sondern haben eine andere Funktion, z.B. „Debütroman“,“Emigrationsroman“,“Hauptroman“ oder „Lieblingsroman“. Einige beziehen sich außerdem auf einen einzigen Text (z.B. „Rosenroman“ oder „Josephsroman“). Die Liste enthält also Begriffe, die keine Gattungsnamen sind und andererseits gibt es noch mehr Bezeichnungen für Gattungen, die aber nicht als Kompositum aufgebaut sind, nämlich in der Verbindung von ADJ + NOUN, also z.B. „sozialer Roman“, „psychologischer Roman“, „philosophischer Roman“ usw. Diese sind in der ersten Fassung der Liste nicht enthalten.

Mit wenig Aufwand kann man aus den Daten, die ja die Verwendungshäufigkeit der Begriffe enthalten, ein Wordle erstellen, indem man einen Text generiert, der die Begriffe anteilig zu ihrer absoluten Häufigkeit enthält. Das Ergebnis sieht so aus:

romangattungen1

Leider ist ‘Kriminalroman’ so dominant, dass die anderen Begriffe sehr schnell in unlesbarer Kleinschreibung verschwinden. Wenn wir ihn aus dem Bild entfernen, ergibt sich diese informationsreichere Übersicht:

romangattungen2

Das ist hübsch. Und es ist ein erster Schritt auf dem Weg eines Überblicks über die Gattungsbegriffe für den Roman. Aber natürlich hat es nur einen eingeschränkten analytischen Wert. Die Ursachen für die hohe Frequenz eines Worts können sehr unterschiedlich sein. Die große Häufigkeit des ‘Kriminalromans’ etwa ergibt sich daraus, dass dies eine eingeführte paratextuelle Bezeichnung ist, die sich im Text findet (Meinem Wissensstand nach sind Titel und Untertitel Teil des Korpus). Der ‘Bildungsroman’ dagegen ist ein Begriff der Beschreibungssprache. Interessant sind Begriffe wie ‘Zeitroman’, die sich am Anfang des 20. Jahrhunderts in einer ganzen Reihe von Romantiteln finden, während er gegen Ende des Jahrhunderts häufiger in Texten über Romane zu finden ist.

Anders ausgedrückt: Die Analyse hat einen ersten Eindruck von der Häufigkeitsverteilung von Gattungsbegriffen ergeben, aber wir können nicht beurteilen, ob es sich hierbei um Begriffe der Objekt- oder Metasprache handelt. Das Problem könnte man möglicherweise lösen, wenn man in einem großen Bibliothekskatalog die Untertitel von Romanen systematisch unter der Perspektive auswertet, welche der hier aufgeführten Kategorien vorkommen. Das würde dann ihre Verwendung in der Objektsprache belegen. Außerdem könnte man, ausgehend von den Publikationsdaten der Romane überprüfen, ob ungefähr gleichzeitig die entsprechenden Begriffe geläufig sind, also Romanmetadaten und Ngramm-Daten abgleichen.

Ein weiteres Problem entsteht durch die Heterogenität der Gattungsbegriffe. Selbst wenn man die Begriffe aussondert, die offensichtlich keine Gattungen bezeichnen, bleibt eine Fülle von Begriffen übrig, die sich auf sehr unterschiedliche Aspekte beziehen, z.B. der inhaltsbezogene Begriff Abenteuerroman und der referenzbezogene Begriff Schlüsselroman. In dieser Form sind sie nur eingeschränkt tauglich für die Korrelierung mit den Ergebnissen von Clustering aufgrund von Textmerkmalen. Dieses Problem könnte durch eine genauere Analyse der Gattungsbegriffe gelöst oder zumindest mal aufgeräumt werden. Und wenn wir schon bei Zukunftsplänen sind: Die historische Information, wann welche Gattungsbegriffe häufiger zu finden sind, könnte man auch noch auswerten, aber das ist nicht ganz einfach zu visualisieren. So etwas ist noch zu unübersichtlich:

romangattungen3

(Link)

Insgesamt also noch ein weiter Weg zu einem brauchbaren Beschreibungssystem von Romangattungen, aber die Frequenzangaben helfen wohl bereits bei der Vereinfachung der vorliegenden Begriffe. Nun müssten noch die 150 anderen Texte zugeordnet werden. Hat jemand Evremont von Sophie Bernhardi gelesen und hätte einen Vorschlag zur Gattungszuordnung? Oder Bruno Willes Glasberg. Henriette von Paalzows Ste. Roche?

Quelle: http://dhd-blog.org/?p=2128

Weiterlesen

Online-Umfrage zu den Schwierigkeiten beim Zugriff auf Holocaust Archivalien

Die International Holocaust Remembrance Alliance (ehemals Task Force for International Cooperation on Holocaust Education, Remembrance, and Research) hat eine Online-Umfrage zu den Schwierigkeiten beim Zugriff auf Holocaust-Archivalien gestartet. Das Ziel der Umfrage ist die Identifizierung der Probleme und zukünftige Lösungsmöglichkeiten.

Die Umfrage ist in Deutsch, Englisch, Französisch und Russisch verfügbar und sollte nur wenige Minuten im Anspruch nehmen.

Wir bitten die Befragten, möglichst ausführliche Antworten zu geben.

Wenn Sie Fragen haben oder weitere Informationen benötigen, besuchen Sie bitte http://www.holocaustremembrance.com/focus/archives oder E-Mail: ihra.survey@gmail.com

Quelle: http://dhd-blog.org/?p=1889

Weiterlesen