Stellenausschreibung: Wissenschaftliche/r Mitarbeiterin/Mitarbeiter im Bereich Digital Humanities und TYPO3 Entwicklung (TV-L 13, Vollzeit)

Die Akademie der Wissenschaften und der Literatur | Mainz sucht für die Digitale Akademie zum nächstmöglichen Termin und zunächst befristet auf 2 Jahre mit der Option einer Verlängerung eine/einen Wissenschaftliche/n Mitarbeiterin/Mitarbeiter im Bereich Digital Humanities und TYPO3 Entwicklung (TV-L 13, Vollzeit).

Zu den Aufgaben gehört die Anwendung und/oder Konzeption von
Technologien, Methoden und -verfahren zur Digitalisierung geisteswissenschaftlicher Forschungsprojekte und Datenbestände (Schwerpunkt: TYPO3 Integration und -entwicklung) im Kontext der Forschungsvorhaben der Mainzer Akademie sowie die Forschung an Kernfragen der Digitalen Geisteswissenschaften mit besonderem Fokus auf den geisteswissenschaftlichen Langzeitprojekten des Akademienprogramms.

Erwartet werden fundierte Kenntnisse im Bereich aktueller Webtechnologien und Programmiersprachen sowie umfassende Praxiserfahrungen in der Applikationsentwicklung mit dem Content Management Framework TYPO3 (insbesondere in der Extensionentwicklung mit Extbase/Fluid).

Die Bewerbungsfrist endet am 26. Juni 2015. Alle weiteren Informationen finden sich in der Stellenausschreibung.



[...]

Quelle: http://dhd-blog.org/?p=5126

Weiterlesen

Der veſte Buchſtab. Digitale Editionen, ihre Erstellung und Darbietung

  Am 29. und 30.  November 2012 fand in der Geschäftsstelle der Max Weber Stiftung das Arbeitstreffen „digital humanities. Wissenschaftliche Datenbanken und Editionsprojekte“ statt. Zwar gibt es gibt noch keinen Königsweg, der in diesem weiten Bereich zu allen Zielen führt. Umso wichtiger sind Übergangsmöglichkeiten von einem Weg zum anderen. Die Überlieferung von Worten ist das wertvollste Kulturgut überhaupt. Bauten und Bilder, Geschmeide, Melodien und Maschinen können uns nützen, uns freuen, uns staunen und schaudern lassen ‒ aber sie reden nie so zu uns wie Worte, von Mensch zu Mensch. Kein Wunder, dass wir gerade auch dieser Überlieferung digitale Dauer zu geben bestrebt sind, kein Wunder aber auch, dass bei der Ausführung des Vorhabens Schwierigkeiten begegnen. Lösungen solcher Schwierigkeiten war das Arbeitstreffen gewidmet, freilich mit Schwerpunktsetzung: Es ging um schriftliche Überlieferung und das Eingeben, Abspeichern, Aufbereiten und Anzeigen von zugehörigen Metadaten (im weiteren Sinn verstanden, worunter auch schon das Transkript zu einer Abbildung fällt). Und es war wirklich fesselnd zu sehen, wie vielfältige und ausgefeilte Lösungsansätze vorgestellt, gelegentlich auch ‒ freundlich und erfreulich lebhaft ‒ gegenübergestellt wurden und wie sie einander ergänzen oder befruchten konnten.   Aus einer Hölderlinhandschrift mit der im Titel angeführten Stelle. Die Transkription (d oder D oder …?) ist ein primär philologisches, nur sekundär technisches Problem. Dazu unten etwas. (Quelle: Württembergische Landesbibliothek Stuttgart: Hs. Homburg.G,2-7: Blatt 6v: Zeile 6. http://digital.wlb-stuttgart.de/purl/bsz346526833. Lizenz CC BY-NC-ND.) FuD, vertreten von Marina Lemaire und Gisela Minn vom Trierer Kompetenzzentrum, zeigte sich als System mit einem erprobten Kern und einer Vielzahl von entwickelten oder in Entwicklung befindlichen Schnittstellen, um so gut wie alle Editionsschritte zu unterstützen ‒ von der kollaborativen Erfassung in einer MySQL-Datenbank der Uni Trier bis zur Veröffentlichung im Netz oder Druck ‒, aber auch den Wechsel hin zu anderen Systemen anbieten zu können. So gab Sebastian Felten vom DHI London einen interessanten Einblick ins Projekt „Pauper Letters and Petitions for Poor Relief in Germany and Great Britain, 1770 – 1914“ und wie dort sowohl FuD als auch das ‒ noch zu erwähnende ‒ DENQ zusammen genutzt werden, das eine zur Eingabe, das andere zur Anzeige im Netz. BASYS-Invenio, vorgestellt von Thekla Kleinschmidt und Branimir Kolev vom Bundesarchiv, wurde und wird auf der Grundlage von Islandora entwickelt, um Archivalien in einem riesigen Gesamtbestand von einigen hundert Terabytes rasch finden und anzeigen zu können. Eingebaut ist eine sehr lesefreundliche Anzeige in Gestalt des Internet-Archive-Viewers, zudem mit einer maschinellen Texterkennung über Tesseract, was eine Suche im Text der jeweils angezeigten Abbildung ermöglicht. Bei den meisten Bundesarchivalien, gedruckt im 20. bis 21. Jahrhundert, zeitigt eine maschinelle Texterkennung gute Ergebnisse. Peter Stadler stellte die Carl-Maria-von-Weber-Gesamtausgabe vor, die in bewunderungswürdig konsequenter und harmonischer Verbindung von philologischen Kardinaltugenden und modernen XML-Techniken erarbeitet wird: Mit Gründlichkeit und Genauigkeit und der echt philologischen Liebe zum Wort wird aus der sichtbaren Überlieferung, dem Bild, ein lesbarer, und zwar maschinenlesbarer Text, der bis zur Anzahl der Striche bei Unterstreichungen alles von der Überlieferung aufhebt, was irgendwie sinnunterscheidend sein könnte. Ruth und Borries von dem Bussche vom Düsseldorfer Unternehmen Fafalter skizzierten dagegen eine Lösung auf der Grundlage von HTML5, das mit RDF-Annotation angereichert wird ‒ eine Verbindung von Sinn- und Gestaltebene, die früher gemieden wurde, jetzt aber im Verlagswesen und überhaupt im geschäftlichen Umfeld mehr und mehr Anklang findet. Auch, um Netzseiten mit mehr maschinenlesbarem Inhalt im Sinne des „semantic web“ zu erstellen, ist HTML5 mit RDF-Anzeichnung die fortgeschrittenste Lösung. Charlotte Schubert von der Universität Leipzig führte eAQUA vor und machte anhand von Beispielen aus ihrer eigenen Forschung deutlich, welchen außerordentlichen Nutzen ein Korpus von diesem Umfang und Lemmatisierungsgrad, zudem versehen mit den Anzeigemöglichkeiten der Kookkurrenzanalyse und der raumzeitlichen Belegverteilung haben kann. Torsten Schrade von der Digitalen Akademie Mainz stellte einen editorischen Arbeitsablauf vor, der von Ausgangsdokumenten in verschiedenen (und nicht immer günstigen) Formaten hin zum Content-Management-System Typo3 führt. Eine besondere Herausforderung ist im Fall des Beispielprojektes „Medieval Ashkenaz“ die Mischung hebräischer und deutscher Teile, also links- und rechtsläufiger Schriftrichtung, was in besonders schweren Fällen mit einem Zusammenspiel aus weicher Auszeichnung (mit <span dir=”rtl”> … </span>) und harten Steuerzeichen (U+202B für ‘ab hier linksläufig’ und U+202A für ‘ab hier rechtsläufig’) gelöst wird. Die Steuerzeichen werden elegant über das CSS, nämlich über eine an die Anzeichnung dir gebundene content-Eigenschaft eingefügt. DENQ, vorgestellt von Jörg Hörnschemeyer (dem Entwickler) und Jan-Peter Grünewälder vom DHI Rom, ist ebenda entwickelt worden, also gleichsam innerhalb der Max Weber Stiftung. Ein Kernbestandteil ist die XML-Datenbank eXist. Gezeigt wurden eine Suche über mehrere Korpora, auch als Ähnlichkeitssuche auf der Grundlage des Lewenstein-Algorithmus, ferner die Anzeige von Belegen in räumlicher Verteilung, unterlegt mit einer geographischen Karte, sowie die Möglichkeit, die Abbildung eines Textes in Ausschnitte zu zerlegen, die im SVG-Format gespeichert und den je entsprechenden Textausschnitten zugeordnet werden können, was noch in Entwicklung ist. Es konnte aber bereits eine gerade für diese Aufgabe äußerst nützliche maschinelle Vorsegmentierung gezeigt werden, die schon erstaunlich gut war. Zur Dateneingabe sonst: In DENQ wurde oder wird für jedes gewünschte Format eine Überführung in eXist entwickelt. Unter anderem möglich ist die Nutzung eines vertrauten Editors wie Word, in dem dann über Formatvorlagen recht bequem eine semantische Auszeichnung bis auf die Ebene des Zeichens hinab vorgenommen werden kann. Es ist bewundernswert, wie viel Funktionalität und Flexibilität auf schmaler Personalbasis entwickelt und ermöglicht worden ist. TextGrid, vorgestellt von Oliver Schmid von der Technischen Universität Darmstadt, ist vielleicht das komplexeste der vertretenen Systeme und bietet einen zumal gemessen am Projektalter großen Umfang an Funktionen sowie Teilprogrammen, die modular entwickelt und vom Nutzer modular eingebunden werden können. Die Eingabeumgebung, TextGridLab, funktioniert als reines Java-Programm ohne Installation (wenn das Java-Runtime-Environment auf dem Rechner installiert ist, was ja meist zutrifft) und auch offline. Das TextGridRep wiederum dient sowohl der gemeinsamen Arbeit an derselben Datenbank, als auch der Langzeitarchivierung und der Veröffentlichung im Netz mit Suchmöglichkeiten. Zwei vielleicht miteinander zusammenhängende Eindrücke vom Arbeitstreffen: Erstens. Es gibt noch keinen Königsweg, der zu allen Zielen führt; umso wichtiger sind Übergangsmöglichkeiten von einem Weg zum anderen. Zweitens. Gerade als Austauschformat ist XML noch immer und bis auf weiteres „die reine Lehre“, wie Gregor Horstkemper von der Bayerischen Staatsbibliothek in seiner Moderation scherzte. Andererseits wurden hin und wieder die Unzulänglichkeiten von XML in den Randbereichen seiner Verwendung deutlich: Wann immer man Geltungsbereiche auszeichnen will, die unterbrochen sind oder einander überlappen, also nicht in die hierarchische Verschachtelung von XML-Dokumenten passen, muss man zu Behelfen greifen, von denen keiner der Standard ist ‒ die TEI-Richtlinien stellen mehrere gleichberechtigt nebeneinander. Und schlimmer: Um die Behelfslösung einzulesen, etwa bei Abfragen, muss man einen eigenen Parser schreiben (adé Standardkonformität) oder auf Reguläre Ausdrücke zurückgreifen (was sonst als blankes Versagen bei der XML-Verarbeitung gilt) oder XPointer verwenden, was noch kaum umgesetzt und überdies mit einem Patent belastet ist, das bei Sun lag, jetzt also bei Oracle liegen müsste (vgl. http://www.w3.org/TR/xptr-framework/, http://www.w3.org/2002/06/xptr_IPR_summary.html). Oracle hat bekanntlich schon wegen eines anderen von Sun geerbten Patentes einen Rechtsstreit begonnen. Dennoch: Stadler, Leiter der TEI-Interessengruppe „Correspondence“, hat XML mit pädagogischem Impetus hochgehalten: Geisteswissenschaftler sollen mit XML umgehen können, weil der Umgang mit Texten, Textstruktur und Textsemantik zum Kernbereich der Geisteswissenschaft gehört, weil die dabei anfallenden Entscheidungen auch nur der Fachwissenschaftler, kein hilfreich herbeieilender Techniker treffen kann und weil der Umgang mit XML auch gar nicht so schwierig ist wie die wirklich harten Probleme ‒ die sind bei einer Edition stets philologischer Natur. Wenn man von der XML-Frage verallgemeinernd absieht, wird der Impetus ein aufklärerischer: Es geht dann um den Ausgang des Geisteswissenschaftlers aus einer selbstverschuldeten Unmündigkeit, was Datenverarbeitung angeht. Besteht diese Unmündigkeit? Und ist sie selbstverschuldet ‒ aus denselben Ursachen, die Kants berühmter Aufsatz nennt? Hier liegt ein Problem, das unangenehmer ist als etwa das vergleichsweise harmlose Ansinnen, die Geisteswissenschaften im Social Web zu verankern. Dr. Stefan Müller ist Referent für Datenbanken in der Geschäftsstelle der Max Weber Stiftung in Bonn, Redaktion Perspectivia.  

Quelle: http://mws.hypotheses.org/1571

Weiterlesen

Wissenschaftliche/r Mitarbeiter/in im Bereich Digital Humanities & TYPO3

Das Team der Digitalen Akademie der Akademie der Wissenschaften und der Literatur Mainz sucht zum nächstmöglichen Termin und befristet auf 1 Jahr mit der Option einer Verlängerung einen Wissenschaftliche/n Mitarbeiter/Mitarbeiterin (1,0 EG 13 TV-L).

Schwerpunkte der Arbeit sind:

  • Anwendung und/oder Konzeption von Technologien, Methoden und –verfahren zur Digitalisierung geisteswissenschaftlicher Forschungsprojekte und Datenbestände (vor allem TYPO3 Systemintegration und –entwicklung)
  • Interdisziplinäre Kooperations- und Publikationstätigkeiten mit national und international tätigen Forschungsgruppen im Bereich der Digital Humanities

Voraussetzungen:

  • Abgeschlossenes Hochschulstudium im Bereich der Geisteswissenschaften oder der Informatik, idealerweise in wechselseitiger Kombination mit informationstechnologischen oder geisteswissenschaftlichen Begleitfächern
  • Fundierte Kenntnisse im Bereich des weborientierten Projektmanagements sowie in den dort angewendeten Technologien und Programmiersprachen
  • Umfassende Erfahrungen in der Systemintegration und Applikationsentwicklung mit dem Content Management Framework TYPO3 (Templating, TypoScript, Rechtemanagement, Extensionintegration und -entwicklung)

Bewerbungsschluss ist der 31.10.2012. Mehr Informationen und die offizielle Ausschreibung finden Sie auf der Website der Akademie.

Quelle: http://dhd-blog.org/?p=974

Weiterlesen

Reichserzkanzlerarchiv online

Screenshot von reichserzkanzler.de

Screenshot von reichserzkanzler.de

Seit Mitte Juli ist www.reichserzkanler.de online. Die Website informiert nicht nur über den Interdisziplinären Arbeitskreis “Kurmainz und der Erzkanzler des Reiches” an der Johannes Gutenberg-Universität Mainz, sondern bietet auch eine frei zugängliche Onlinedatenbank zum Archiv des Reichserzkanzlers. Der Webauftritt und die Datenbank wurden mit TYPO3 realisiert.

Das Archiv des Reichserzkanzlers befindet sich heute im Haus-, Hof- und Staatsarchiv Wien. Im Institut für Geschichtliche Landeskunde an der Universität Mainz sind seit Ende der 70er Jahre Mikrofilme der Bestände vorhanden. Die Archivalienverfilmungen und die ebenfalls dort vorhandene Regestenkartei stehen allen Interessierten außerhalb der Universität zur Verfügung. Der interdisziplinäre Arbeitskreis “Kurmainz und der Erzkanzler des Reiches” hat es sich zum Ziel gesetzt, in Mainz eine Forschungsstätte “Reichserzkanzler” aufzubauen. Unter der Leitung von HD Dr. habil. Ludolf Pelizaeus wird daran gearbeitet, die Bestände in digitaler Form der Allgemeinheit zugänglich zu machen. Hierzu wurde eine Online-Datenbank aufgebaut, in der die Regesten im Volltext recherchiert werden können. Bisher wurden von etwa 8.500 Regesten auf Karteikarten rund 1600 Regesten in die Datenbank eingegeben.

Die Datenbank wurde von Torsten Schrade in TYPO3 realisiert, das als Open-Source-Software auf MySQL und PHP läuft. Basis der Datenbank ist neben dem Content-Management-System selbst die TYPO3-Erweiterung “Historcial Sources Online Database” (HISODAT), die von Torsten Schrade speziell im Hinblick auf die digitale Verwaltung von Quellen im Internet entwickelt wurde. Die Erweiterung stellt das Grundgerüst für die Quellendatenbank zur Verfügung. Dieses Grundgerüst muss aber noch stark für den jeweiligen Einsatz und die zu verwaltenden Quellen angepasst werden.

In einem Datensatz des digitalen Reichserzkanzlerarchivs können alle relevanten Informationen des Regests – wie z.B. Signatur, Archiv, Datierung und Quellenberschreibung – eingetragen und gespeichert werden. Wiederkehrende Angaben kann der Bearbeiter nach dem erstmaligen Erstellen einfach über eine Liste auswählen, so dass Fehler und Duplikate bei Archiven, Schlagworten, Personen usw. vermieden werden können. Auch können die Quellen untereinander verlinkt werden. Zur besseren Recherche wird die Datierung zudem mehrfach in verschiedenen Formaten hinterlegt: so können auch datentechnisch schwierig fassbare Datierungen wie “um 1500″ recherchiert und gleichzeitig korrekt wiedergegeben werden. Das Anhängen von Bildern an den Regest ist technisch bereits möglich. Damit könnten Forscherinnen und Forscher direkt in der Quelle  lesen. Vor einem größeren Einspielen des bereits vorhandenen Mikrofilmmaterials müssen jedoch noch Rechts- und Kostenfragen geklärt werden.

Da die Erweiterung auf TYPO3 aufsetzt, konnte wertvolle Entwicklungszeit für das Userinterface gespart werden. Außerdem wurde so eine nahtlose Präsentation im Internet möglich. Die Extension kam hier nicht zum ersten Mal zum Einsatz. Vorher wurde sie für das Projekt “Inschriften Mittelrhein-Hunsrück” (IMH) verwendet. Durch die erneute Verwendung konnten aber einige Fehler ausgebügelt und Verbesserungen eingebaut werden:  “Es hat der Entwicklung der Extension vor allem gut getan, dass die Daten – im Gegensatz zum IMH-Projekt – per Hand eingegeben wurden und nicht eingespielt werden mussten”, zeigte sich Schrade erfreut. Eine Weiterentwicklung der Erweiterung HISODAT kommt demnächst übrigens im Rahmen der neuen Plattform Deutsche Inschriften Online zum Einsatz.

Quelle: http://digiversity.net/2009/reichserzkanzlerarchiv/

Weiterlesen