Lehre und Ausbildung – Seite 9

Allgemein, Big Data, Digital Text Analysis, Forschung, Forschung (Methode), Göttingen Centre for Digital Humanities, Lehre und Ausbildung, Markup Languages, Porträt (Projekt), Text Reuse

BMBF geförderte Nachwuchsgruppe “eTRAP – electronic Text Re-use Acuisition Project”

12. März 2015 Keine Kommentare

Wir freuen uns, die durch das Bundesministerium für Bildung und Foschung (BMBF) finanzierte und am Göttingen Centre for Digital Humanities (GCDH) angesiedelte Nachwuchsgruppe eTRAP (electronic Text Reuse Acquisition Project) bekannt machen zu dürfen.

eTRAP ist eine international und interdisziplinär zusammengestellte Forschergruppe, die ab 1. März 2015 für vier Jahre vor dem Hintergrund der Klassischen Philologie, Geschichte, den Digital Humanities, der Natürlichen Sprachverarbeitung sowie der Visualisierung und der Paläografie/Kodikologie (Handschriftenkunde) an der Georg-August-Universität Göttingen forschen und lehren wird.

Im Fokus der Arbeiten steht dabei das Interesse daran, wie Paraphrasen, Allusionen oder auch Übersetzungen (im Generellen Re-Use) von historischen Autoren in ihren Arbeiten weitergegeben wurden, warum Re-use weiter gegeben wurde und welche Intensionen und Einflüsse dabei eine Rolle gespielt haben. Die Nachwuchsgruppe möchte damit eine Methodik schaffen, mit der „Historischer Text Re-use“ trotz seiner starken Diversität (aufgrund langer Überlieferungslinien, sprachlicher und kultureller Einflüsse, Zerstörung) beschrieben und messbar gemacht werden kann. So werden beispielsweise viele statistische Maße unbrauchbar, wenn historische Texte einen signifikanten Anteil von Re-use enthalten. Diesen gründlich zu erfassen, ist jedoch auf variantem, historischem Text noch keineswegs gelöst. Als Untersuchungsgrundlage werden Big Data hinzugezogen, also Daten, die zu umfangreich sind, um sie manuell bearbeiten zu können. Es werden Texte in den Sprachen Altgriechisch, Deutsch, Englisch, Italienisch und Latein bearbeitet.

Weitere Informationen zum Projekt und zur Nachwuchsgruppe finden Sie unter http://etrap.gcdh.de/

Quelle: http://dhd-blog.org/?p=4853

community, ESU, Forschung, Forschungsförderung, Forschungsinfrastruktur, Lehre und Ausbildung, Markup Languages, Porträt (Projekt), poster, sommeruniversität, Studium, Summer School, Theorie, Veranstaltungen, Vorlesung, Workshop

Ausschreibung der Europäischen Sommeruniversität in Digitalen Geisteswissenschaften “Kulturen & Technologien”

23. Februar 2015 Keine Kommentare

“Kulturen & Technologien” – Europäische Sommeruniversität in Digitalen Geisteswissenschaften 28. Juli bis 07. August 2015, Universität Leipzig http://www.culingtec.uni-leipzig.de/ESU_C_T/

Wir freuen uns, mitteilen zu können, dass Interessierte sich schon einen Account bei ConfTool einrichten können und dass die Phase der Bewerbung um einen Platz bei der Sommeruniversität in Digitalen Geisteswissenschaften “Kulturen & Technologien” am 28. Februar 2015 beginnt.

Die Sommeruniversität wird dieses Jahr zusammen mit CLARIN-D, einem vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Infrastrukturprojekt für die Geisteswissenschaften, und dem Humboldt Chair in Digital Humanities der Universität Leipzig ausgerichtet.

Nicht nur der Deutsche Akademische Austauschdienst (DAAD) unterstützt die Teilnahme an der Europäischen Sommeruniversität großzügig mit Stipendien, sondern auch die Universität Leipzig, die über ihr Akademisches Auslandsamt Stipendien für Mitglieder ihrer osteuropäischen Partneruniversitäten zur Verfügung stellt, und das Electronic Textual Cultures Lab der University of Victoria (etcl), das zusammen mit dem Digital Humanities Summer Institute die Teilnahmegebühren für bis zu 5 TeilnehmerInnen übernimmt (vgl. http://www.culingtec.uni-leipzig.de/ESU_C_T/node/480).

Die Sommeruniversität richtet sich an 60 TeilnehmerInnen aus ganz Europa und darüber hinaus. Sie will Studierende, DoktorandInnen und (Nachwuchs-) WissenschaftlerInnen aus den Geisteswissenschaften, den Bibliothekswissenschaften, den Sozialwissenschaften, den Ingenieurwissenschaften und der Informatik als gleichwertige PartnerInnen zu einem wirklich interdisziplinären Wissens- und Erfahrungsaustausch in einem mehrsprachigen und mehrkulturellen Kontext zusammenführen und so die Voraussetzungen für künftige projektorientierte Kooperationen und Netzwerkbildungen über die Grenzen der Disziplinen, Länder und Kulturen hinweg schaffen.

Die Sommeruniversität will einen Raum zum Diskutieren, Erwerben und Ausbauen von Kenntnissen, Fähigkeiten und Fertigkeiten in Methoden und Technologien schaffen, die im Bereich des Humanities Computing eine zentrale Rolle spielen und immer mehr die Arbeit in den Geistes- und Kulturwissenschaften, in Verlagen, Bibliotheken, Archiven, Museen und ähnlichen Bereichen bestimmen. Die Beschäftigung mit diesen Methoden und Technologien will sie in den größeren Kontext der Digital Humanities stellen, die nach den Konsequenzen und Implikationen der Anwendung computationeller Methoden und Tools auf Artefakten aller Art fragen.

Bei all dem setzt sich die Sommeruniversität auch das Ziel, dem sogenannten Gender Divide zu begegnen, das heißt der Unterrepräsentation von Frauen im Bereich der Informations- und Kommunikationstechnologien (IKT) in Deutschland und Europa. Statt aber die Hard Sciences als solche zu stärken, indem sie wie so viele Maßnahmen die sogenannten MINT-Fächer fokusiert und versucht, Mädchen und Frauen von der Attraktivität und Bedeutung der Informatik oder der Ingenieurwissenschaften zu überzeugen, setzt die Sommeruniversität auf die Herausforderung, die die Geisteswissenschaften im weitesten Sinne mit ihren überaus komplexen Daten und ihrem Reichtum an Frauen für die Informatik und die Ingenieurwissenschaften und deren Weiterentwicklung bieten, auf die Überwindung der Grenzen zwischen den sogenannten Hard und Soft Sciences sowie auf die Integration von Geisteswissenschaften, Informatik und Ingenieurwissenschaften.

Die Sommeruniversität dauert volle 11 Tage. Ihr intensives Programm setzt sich aus Workshops, hochschulöffentlichen Vorlesungen, regelmäßig stattfindenden Projektpräsentationen, einer Postersession und einer Podiumsdiskussion zusammen. Was spezifisch das Workshop-Programm betrifft, so werden die folgenden parallel laufenden Kurse angeboten:

XML-TEI encoding, structuring and rendering
Methods and Tools for the Corpus Annotation of Historical and Contemporary Written Texts
Comparing Corpora
Spoken Language and Multimodal Corpora
Python
Basic Statistics and Visualization with R
Stylometry
Open Greek and Latin
Digital Editions and Editorial Theory: Historical Texts and Documents
Spatial Analysis in the Humanities
Building Thematic Research Collections with Drupal
Introduction to Project Management

Jeder Workshop umfasst insgesamt 16 Sitzungen oder 32 SWS. Die Zahl der TeilnehmerInnen eines Workshops ist auf 10 begrenzt. Die Workshops sind so strukturiert, dass entweder beide Blöcke eines Workshops oder zwei Blöcke verschiedener Workshops besucht werden können.

Informationen zur Bewerbung um einen Platz in einem oder zwei Workshops sind unter http://www.culingtec.uni-leipzig.de/ESU_C_T/ zu finden.

Bevorzugt werden Geistes- und SozialwissenschaftlerInnen, die ein Technologie-gestütztes Forschungsprojekt planen bzw. schon an einem solchen Projekt arbeiten und dieses qualifiziert beschreiben. Von den InteressentInnen aus den Ingenieurwissenschaften und der Informatik wird erwartet, dass sie ihre (bisherigen) Schwerpunkte und Interessen so beschreiben, dass auch Fachfremde sie verstehen, und dass sie ihre Erwartungen an die Sommeruniversität begründet darlegen.

Bewerbungen werden nach ihrem Eingang berücksichtigt. Die Bewerbungen werden vom wissenschaftlichen Komitee und den Workshop-LeiterInnen begutachtet.

Die Teilnahmegebühren sind die gleichen wie 2014.

Alle wichtigen Informationen sind im Web-Portal der Europäischen Sommeruniversität in Digitalen Geisteswissenschaften “Kulturen & Technologien” http://www.culingtec.uni-leipzig.de/ESU_C_T/ zu finden. Das Portal wird fortwährend aktualisiert und mit weiteren Informationen angereichert.

Elisabeth Burr

Prof. Dr. Elisabeth Burr
Französische / frankophone und italienische Sprachwissenschaft
Institut für Romanistik
Universität Leipzig
Beethovenstr. 15
D-04107 Leipzig
http://www.uni-leipzig.de/~burr

Quelle: http://dhd-blog.org/?p=4766

Digitale Edition, Dixit, IDE, Lehre und Ausbildung, Oesterreich, Summer School, TEI, XML

IDE meets DiXiT – Spring School 2015 Advanced XML/TEI technologies for Digital Scholarly Editions

17. Dezember 2014 Keine Kommentare

Call for Participation:

We are very pleased to announce the Spring School on Advanced XML/TEI technologies for Digital Scholarly Editions organized and endorsed by the Institute for Documentology and Digital Editing e.V. (IDE) and the Digital Scholarly Editions Initial Training Network (DiXiT). The spring school will be run and held at the at the Centre for Information Modelling – Austrian Centre for Digital Humanities at the University of Graz from 13th to 17th April 2015.

The spring school is directed to participants with previous experience in XML/TEI editing who would like to involve themselves more intensively with the creation of digital scholarly editions based on the international encoding standard XML TEI P5. Besides addressing specific issues and use cases of text encoding, the participants will be trained what to do with the data once the encoding is done and how to process it further until the publication on the WWW. To this end the teaching will strongly focus on XPath, XSLT, HTML and CSS as technologies for the web publication of digital scholarly editions.

Since the level of this spring school is advanced, previous knowledge of TEI practices is not only recommended but necessary for participation.

The lectures will be held by experts from the field of Digital Scholarly Editing, related to the DiXiT network or the IDE (James Cummings, Franz Fischer, Ulrike Henny, Torsten Schaßan, Martina Semlak, Magdalena Turska, Gunter Vasold, Georg Vogeler). Tara Andrews (Univ. of Bern) has agreed to give a keynote.

The School will cover the following areas:

issues when working with XML TEI P5 (to be proposed by the participants)
customization of the TEI schema
creating web pages with HTML/CSS and JavaScript and JQuery
transforming the TEI XML with XSLT/XPath
publishing frameworks for digital scholarly editions
use cases for research on and with digital scholarly editions

The IDE-meets-DiXiT Spring School on Advanced XML/TEI technologies for Digital Scholarly Editions is open to interested scholars anywhere in the world with previous experience in digital scholarly editing with the TEI. As the course will strongly focus on practical exercise, we can accept only applications which can bring own material for the exercises. All teaching will be in English.

The course offers 20 positions. Participants will be required to arrange their own accommodation and travel to Graz. The participation fee will be 100 EUR. A limited number of bursaries will be available for the participation fee, travel and accommodation in particular for participants from less developed countries and from Eastern Europe.

Application closes on 10st February 2015 and early registration is highly recommended.

For the application we need from you

your name, address, e-mail, institutional affiliation (if applicable)
a short description of your project
this online questionnaire

If you want to be considered for the bursary please give indicate

approximate amount for travel and accommodation expenses
do you need a reduction on the participation fee?
academic status (graduate student, PhD student, PostDoc, fully trained scholar, other)

Please send your application and any question you have to dixit@uni-graz.at

We will publish further information on the school at http://www.i-d-e.de/aktivitaeten/schools/spring-school-2015

Quelle: http://dhd-blog.org/?p=4516

Lehre und Ausbildung, Veranstaltungen

CLARIN-D Reisestipendien für die DHd-Tagung 2015

11. Dezember 2014 Keine Kommentare

Zur DHd 2015 vergibt CLARIN-D drei Reisekostenstipendien in Höhe von jeweils bis zu 300,00 EUR an NachwuchswissenschaftlerInnen, die an der DHd Jahrestagung vom 23.-27. Februar 2015 in Graz teilnehmen. CLARIN-D ist als deutsches Forschungsinfrastrukturprojekt aus dem Bereich der digitalen Geisteswissenschaften Teil des europäischen CLARIN-Verbundes (CLARIN ERIC).

Bedingungen:

– Teilnahmeberechtigt sind alle NachwuchswissenschaftlerInnen (insbesondere in der Master- oder Promotionsphase), die einen Beitrag (Poster oder Vortrag) erfolgreich für die Tagung eingereicht haben.

– Erforderlich ist die Registrierung für die Tagung bis zum 10. Januar sowie eine Bewerbung um das Stipendium per E-Mail an thorsten.trippel@uni-tuebingen.de bis spätestens 15. Januar 2015 (12 Uhr MEZ). Der E-Mail beizufügen ist eine PDF-Datei mit tabellarischem Lebenslauf (max. 1 Seite) sowie eine Kopie der Benachrichtigungsemail, dass der Beitrag für die Tagung angenommen wurde, sowie der eingereichte Abstract.

– Die Preisträger verpflichten sich, bis spätestens zwei Wochen nach Konferenzende einen einseitigen Bericht über ihre Erfahrungen auf der Tagung zu verfassen und per E-Mail an CLARIN-D (über thorsten.trippel@uni-tuebingen.de) zu senden.

Auswahlkriterien:

– Qualität des Abstracts, insbesondere nach den Kriterien Originalität und Innovation.

– Bei gleicher Qualität und mehr Bewerbungen als Stipendien entscheidet das Los (der Rechtsweg ist ausgeschlossen).

Die PreisträgerInnen werden auf der Tagung benannt. Eine Erstattung der Reisekosten erfolgt nach der Konferenz, den PreisträgerInnen werden die Modalitäten bei der Vergabe mitgeteilt.

Für Fragen zum CLARIN-D Reisestipendium für NachwuchswissenschaftlerInnen wenden Sie sich bitte an Thorsten Trippel (thorsten.trippel@uni-tuebingen.de).

Quelle: http://dhd-blog.org/?p=4459

DARIAH-DE, Digitale Edition, Lehre und Ausbildung, Markup Languages, Schulungsmaterialien, Text Encoding Intiative, Textkodierung, Tutorial, Übungsaufgaben, Würzburg, XML-Print

DARIAH-DE Tutorial “Digitale Textedition mit TEI” online

7. Juli 2014 Keine Kommentare

Kodierung von “surface” und “zone” beim dokument-zenrierten Kodieren mit TEI.

Das DARIAH-DE Tutorial Digitale Textedition mit TEI ist nun vollständig online. Das Tutorial, das Teil der DARIAH-DE Schulungsmaterialien ist, besteht aus einer Reihe von Kapiteln, die aufeinander aufbauend in verschiedene Aspekte der Kodierung und Edition von Texten nach den Guidelines der Text Encoding Initiative einführen.

Das Tutorial ist für den Einsatz in der Lehre konzipiert, kann aber auch im Selbststudium eingesetzt werden. Für weiterführende Lektüre zum Thema verweisen wir auf die Sammlung zum Thema “Enrichment” in der Doing Digital Humanities”-Bibliographie, die von DARIAH-DE auf Zotero zur Verfügung gestellt wird.

Jedes Kapitel behandelt einen bestimmten Aspekt des Themas und besteht jeweils aus drei Elementen: erstens aus einem Foliensatz für ein Inputreferat, das in die wichtigsten jeweils einschlägigen Begriffe und Elemente der TEI einführt; zweitens aus einem oder mehreren Aufgabenblättern, die zur praktischen Einübung des Gelernten dienen; und drittens aus den diversen Materialien, die für die Bearbeitung der Aufgaben notwendig sind, bspw. digitale Faksimiles, Transkriptionen, XML-Dateien, und mehr. Das Tutorial umfasst die folgenden Kapitel:

Einführung in die digitale Textedition
Was sind Markup und XML?
Grundlagen der Textkodierung mit TEI
Die TEI Guidelines, Kapitel 1-23
Metadaten im teiHeader festhalten
Primärquellen kodieren
Varianten kodieren
Dokument-zentriertes Kodieren
Manuskript-Beschreibung
TEI anpassen mit Roma
Verwendung von XPath

Die Tutorials wurden von Christof Schöch an der Universität Würzburg umgesetzt und sind in den vergangenen zwei Jahren u.a. im Rahmen von DARIAH-DE entwickelt worden und konnten bisher in einer Reihe von Lehrveranstaltungen (universitäre Lehrveranstaltungen auf BA-Niveau sowie diverse Workshops für NachwuchswissenschaftlerInnen aus den Geisteswissenschaften) eingesetzt werden. Die Publikation als DARIAH-DE Schulungsmaterial konnte mit Unterstützung durch Mareike Laue, Philip Dürholt, Sina Bock und Keli Du, Universität Würzburg, realisiert werden. Die Aufgabenblätter selbst sind in TEI geschrieben und wurden mit Hilfe des Satzprogramms XML-Print automatisch in PDF-Dateien verwandelt.

Die Folien und Aufgaben basieren in großen Teilen auf den Materialien, die das Team “Digital Humanities @ Oxford” für die dortige Summer School 2012 entwickelt und veröffentlich hat. Die Materialien sind durchgehend nicht nur übersetzt, sondern auch weiter entwickelt und durch neue Themen, Aufgaben und Materialien ergänzt worden. Dies ist aufgrund der Creative-Commons-Lizensierung der Oxforder Materialien möglich. Wir publizieren die vorliegenden Tutorials mit der Lizenz Creative Commons Attribution 4.0 International (CC-BY), um weitere Bearbeitungen zu ermöglichen.

Neben den PDF-Dateien, die zur unmittelbaren Nutzung heruntergeladen werden können, stehen auch die XML-Dateien der Aufgabenblätter <http://dev.dariah.eu/svn/TTEI/Aufgaben/XML/> (einschließlich des RNG-Schemas, der ODD-Datei sowie der beiden Konfigurationsdateien für XML-Print) zum Download bereit. Dadurch können im Sinne der CC-BY Lizenz von Dritten Anpassungen an den Aufgaben vorgenommen und erneut mit XML-Print veränderte PDF-Dateien generiert werden. Die Speicherung im Hintergrund erfolgt in einem SVN-Repository, das die Nachverfolgung aller zukünftigen Änderungen erlaubt.

Über Rückmeldung zu dem TEI-Tutorial (sei es Lob, seien es Hinweise auf Ungenauigkeiten) freuen wir uns sehr und bitten um eine kurze Email an christof.schoech@uni-wuerzburg.de.

Quelle: http://dhd-blog.org/?p=3722

community, Lehre und Ausbildung, Schulungsmaterial

DARIAH-DE Schulungsmaterial – Mitmachen und Verbreiten

1. Juli 2014 Keine Kommentare

von Johanna Puhl, Universität Köln

In DARIAH-DE wurde in den letzten Monaten damit begonnen Schulungsmaterial zu Verfahren, zu Methoden und zu Themen der Digital Humanities über das DARIAH-DE Portal zur Verfügung und zur Nachnutzung bereit zu stellen. Die aktuelle Schulungsmaterial-Sammlung enthält sowohl Materialien, die im Rahmen von DARIAH-DE entwickelt und zusammengestellt wurden, aber besteht auch aus Schulungs- und Lehrmaterial von international forschenden und lehrenden Wissenschaftlerinnen und Wissenschaftlern. Das gesamte Material wurde mit einer Reihe von Schlagworten angereichert und kann so einfach durchsucht und genutzt werden. Die daraus resultierende Sammlung befindet sich auf https://de.dariah.eu/schulungsmaterial. Das gesamte innerhalb von DARIAH-DE produzierte Schulungsmaterial wird unter CC-BY zur Verfügung gestellt.

DARIAH-DE strebt an, diese Sammlung weiter auszubauen, um eine zentrale Schulungsmaterial-Sammlung, die sich explizit auf eine Nachnutzung für digital Forschende und Lehrende ausrichtet, aufzubauen.

Sie haben DH-Schulungsmaterial, das Sie selbst – beispielsweise für eine Lehrveranstaltung oder Workshops – entwickelt oder geschrieben haben und das Sie über DARIAH-DE anderen Forschenden und Lehrenden zur Weiterverbreitung, Nachnutzung oder auch zur Ergänzung und zum Ausbau zur Verfügung stellen möchten?
Sie kennen DH-Schulungsmaterial im Netz, das in der Übersicht bisher nicht auftaucht, aber von großem Interesse für Forschende, Lehrende und Studierende im Feld der Digital Humanities ist?
Sie haben Fragen oder Anregungen zu unserer bisherigen Sammlung?

… Dann freuen wir uns, wenn Sie sich bei uns unter info@de.dariah.eu mit Lizenznennung Ihres DH-Schulungsmaterials melden.

Quelle: http://dhd-blog.org/?p=3717

community, Lehre und Ausbildung, Veranstaltungen

DH 2014 Workshop: The Representation of Multiplicity as a Means to Digital Cultural Empowerment

25. Juni 2014 Keine Kommentare

Die DH Conference 2014 nähert sich und wir möchten es nicht versäumen, an dieser Stelle auf unseren Pre-Cobference-Workshop “The Representation of Multiplicity as a Means to Digital Cultural Empowerment” aufmerksam zu machen. Wir, das sind Valeria Vitale, PhD Studentin vom King’s College Lodon, Stuart Dunn, Lecturer vom King’s College und ich, Mareike Höckendorff, Doktorandin an der Uni Hamburg. In dem ganztägigen Workshop geht es uns darum, Strategien zu entwickeln, wie in konkreten Projekten praktischer oder theoretischer Art, Multiplizität berücksichtigt und sogar gefördert werden kann. Dazu bringen wir zwei unserer eigenen Projekte als Beispiele mit. Eines beschäftigt sich mit der Entwicklung eines 3D Modells für Pompeii, das andere baut unter dem Namen efoto-hamburg eine Bilddatenbank auf, die gleichzeitig Archiv und virtueller Ort kultureller Begegnung werden soll. Der Workshop richtet sich an alle Interessierten aus den Bereichen Cultural Heritage, Narratologie, Kunstgeschichte, Archäologie, Fotografie und – da praktische Lösungen uns ebenso sehr am Herzen liegen wie theoretische – natürlich Informatik.

Multiplizität und digitale Demokratie

Multiplizität kann im Rahmen der Repräsentation kulturellen Erbes auf vielfache Weise vertreten sein; durch verschiedene Zeitebenen, verschieden klassifizierte Objekte, unterschiedliche Realitätsebenen oder unterschiedliche Sichtweisen, die von Faktoren wie Kontext, Interesse oder Wissen abhängig sind. Nicht selten bedeutet die Beschäftigung mit kulturellem Erbe auch, Dinge zu betrachten, die physisch nicht mehr vorhanden sind und darum nur noch in Aufzeichnungen und Erinnerungen existieren.

Digitale Demokratisierung kultureller Prozesse bedeutet für uns, Kultur auf möglichst vielen der oben genannten Ebenen zugänglich zu machen. Rohdaten wie Bilder, literarische Texte, Filme oder Musik stehen neben Interpretationen, Mashups, Kommentaren und Diskussionen. Die digitale Umgebung sollte so gestaltet werden, dass Nutzer sie ebenso passiv erkunden wie das Datenmaterial aktiv für eigene Darstellungen verwenden können.

Zwei Projekte als Kick-Off

Das erste Projekt, das wir vorstellen wollen ist efoto-hamburg. Die Idee dafür entstand in der Kulturbehörde der Stadt Hamburg und setzte bei der Zusammenführung unterschiedlicher kultureller Daten zu einem multiplen Gesamtkonvolut an. Ganz praktisch gesprochen, heißt das, dass sämtliches in Archiven ruhendes fotografisches Datenmaterial der Stadt in eine gemeinsame Datenbank überführt werden soll. In Zusammenarbeit mit der Universität Hamburg wurde diese Idee so ausgeweitet, dass nicht nur ein weiteres Portal für kulturelle Daten entstehen wird, sondern Nutzer aktiv in die Prozesse der digitalen Kuration, Verschlagwortung und Diskussion der Bilder einbezogen werden. Der Nutzer wird so in einen konstruktivistischen Prozess verwickelt, in dem er, sei es durch passive Erkundung der Daten oder durch aktives Hinzufügen eigener Bilder und Annotationen, Teil eines gestalterischen Prozesses des städtischen Kulturraumes wird.

Das zweite Projekt, das als Kick-Off für die Projektpräsentationen vorgestellt wird, beschäftigt sich mit der Darstellung archäologischen Erbes am Beispiel des Isis Tempels in Pompeii. In den letzten 250 Jahren hat die Ausgrabungsstätte Pompeii vielfältige Interpretationen verbaler und visueller Art hervorgebracht. Verschafft man sich einen Überblick über diesselben, so stellt man schnell fest, dass der dahinter liegende Interpretationsprozess von wechselnden sozialen und kulturellen Variablen beeinflusst wird und so nie als abgeschlossen betrachtet werden kann. Die Darstellung dieser Interpretationen hat zudem viele gemeinsame Funktionalitäten mit der Praxis des Storytellings. Ziel des Projektes ist es, ein digitales Tool zu entwickeln, das für ein konretes archäologisches Objekt sowohl die multiplen restaurativen Hypothesen als auch Interpretationen zugänglich macht. Auf diese Weise entsteht eine kritische Darstellung dieses Objektes als Teil des kulturellen Erbes, die davon wegführen soll, der Öffentlichkeit einzelne, notwendig vereinfachte und unbefriedigende Teilstücke archäologischer Forschung als Ergebnisse zu präsentieren. Stattdessen soll ein partizipativer Austausch angeregt werden, bei dem der Öffentlichkeit die Komplexität der Thematik nicht vorenthalten wird und sie so dazu eingeladen wird, eigene Interpretationen zu finden.

Was die Teilnehmer noch erwartet

Nach der Präsentation dieser beiden Beispielprojekte sind die Workshopteilnehmer dazu aufgefordert, eigene Ansätze, Experimente oder Erkenntnisse zum Thema vorzustellen. Das darf gerne anhand von konkreten Projekten oder Forschungsfragen sein, die kurz präsentiert werden. Anschließend werden die einzelnen Aspekte und Thematiken anhand eines Leitfragenkataloges diskutiert und zusammengeführt. Ziel des Workshops ist es, Ansätze einer Handlungsstrategie für die Darstellung von Multiplizität in digitalen Cultural Heritage Projekten festzuhalten und für alle Teilnehmer aufzubereiten. Außerdem freuen wir uns über regen Austausch mit Projekten, die sich ähnlichen Herausforderungen stellen wie wir mit efoto-hamburg und der 3D Rekonstruktion des Isis-Tempels in Pompeii.

Mehr Informationen zu efoto unter www.efoto-hamburg.de

Mehr zum Workshop hier

Quelle: http://dhd-blog.org/?p=3670

Allgemein, Lehre und Ausbildung, Studium

Masterstudiengang: Digital Humanities an der Universität Trier

21. Mai 2014 Keine Kommentare

Voraussichtlich ab dem Wintersemester 2014/15 können die ersten Studierenden an der Universität Trier ein Masterstudium im Studiengang Digital Humanities (M. Sc.) aufnehmen.

Der neu eingerichtete bilinguale (Deutsch – English) Studiengang ist im Fach Computerlinguistik und Digital Humanities angesiedelt und wird in Zusammenarbeit mit dem Trier Center for Digital Humanities angeboten. An der Schnittstelle von Informatik- und Geisteswissenschaften vermittelt das Studium Bachelor-Absolventen beider Disziplinen Kernkompetenzen eines aufstrebenden Wissenschaftszweiges.

In einer Regelstudienzeit von vier Semestern erwerben die Studierenden zunächst die den persönlichen Schwerpunkt ergänzenden Grundlagen aus den Bereichen Informatik oder Geisteswissenschaften. Im weiteren Verlauf werden Fertigkeiten der Repräsentation, der digitalen Aufbereitung sowie der Visualisierung und Analyse geistes- und kulturwissenschaftlicher Daten, sowohl textueller als auch multimedialer Natur, vermittelt.

Trier bietet nicht nur aufgrund seines kulturellen Erbes und seiner langen Forschungstradition in den Digital Humanities und der Computerlinguistik einen idealen Ausgangspunkt für innovative geisteswissenschaftliche Forschung, auch die Vernetzung zur Universität der Großregion mit den Ländern Frankreich, Luxembourg und Deutschland fördert interkulturelle Vielfalt. Studierende erhalten durch die Verknüpfung mit sprach- und literaturwissenschaftlichen sowie kunsthistorischen Seminaren eine breite geisteswissenschaftliche Ausrichtung. Zudem ermöglicht die enge Anbindung an das Trier Center for Digital Humanities sowie die Kooperation mit verschiedenen kulturhistorischen Instituten in der Region die projektnahe Praxis für angehende Wissenschaftler.

Der Studiengang wird vorbehaltlich der ausstehenden Akkreditierung ab dem Wintersemester 2014/15 angeboten. Die Bewerbungsfrist für Studierende endet am 13.09.2014, für ausländische Studierende am 15.07.2014.

Weitere Informationen erhalten Sie auf der Seite des Faches Computerlinguistik und Digital Humanities

Ansprechpartner:

Prof. Dr. Caroline Sporleder
Universität Trier
FB II – Computerlinguistik und Digital Humanities
+49 651 201-3363
sporledc@uni-trier.de

Quelle: http://dhd-blog.org/?p=3517

Lehre und Ausbildung, Preservation of digital art, sommeruniversität

MOOC on Digital Art & Culture

20. Mai 2014 Keine Kommentare

An Open Online Course about identification, documentation and conservatory understanding of digital art and culture

June 4^th to October 19^th 2014

The BUA-MOOC on Digital Art and Culture provides insight into the digital net culture, the aspects of its historical development and its current challenges. MOOC means Massive Open Online Course and is a public learning format, which is accessible via internet for free to whom it may concern.

The BUA-MOOC on Digital Art and Culture shows where Digital Art and Culture can be found on the net and how it actually looks like. It explains how “digital culture” (as art) can be read and learnt and how this engagement in artistic works and interventions help us understand contemporary art.

Theoretical inputs and fundamental techniques like identification and documentation, as well as, applied approaches to preservation will be presented. The MOOC illustrates the important stages in the digital lifecycle, production, reception and preservation, clearly showing how, where and with whom the introduced issues are debated.

The BUA-MOOC is divided into three thematic sections

Finding & Identifying artistic & cultural activities on the Internet.

Identifying places on the internet where digital culture can be found
Learning how to qualify relevance and understanding the basic structure of digital curation & preservation lifecycles
Learning from examples and case studies of others

Reading & Documenting artistic & cultural activities of digital art and culture.

Reading technologies – approaching to web-based content from the users side
Identification tools and technologies
Describing and documenting experiences in a clearly structured and reproducible way

Living & Understanding artistic & cultural activities.

Database based artworks / Artistic Examples
Maintaining and safe-guarding of complex digital objects
Databases to store knowledge on cultural heritage objects

The MOOC shows the state of the art and presents different perspectives, techniques and level of depths. Apart from general reference materials and an overview of information portals, journals and platforms, individual exercises are available to revise your daily work practices. Helpful tools and standards e.g. CIRDOC CRM are introduced.

Course Structure

The MOOC is open from June 4^th to October 19^th 2014. During the course case studies and other research activities can be presented. Collaboration in smaller learning groups is intended.

Webinars: We will start with a series of 3 live online seminars (webinars) (90-min). The three online seminars (webinars) introduce the three thematic sections with the use of input presentations. Subsequent to the presentations a moderated discussion takes place, where the questions posted by the audience over the virtual seminar chat room, are addressed and discussed.

Date: June 4^th, 5^th and 6^th 2014 each at 04:30 pm

Access: online https://collab.switch.ch/bua_mooc/.

Technical requirements: Web browser and Internet connection, speakers/headphones.

No pre-registration necessary.

When entering the room you will be asked to provide your name.

Online Videos

The contents of the webinars are extracted and bundled into short video sequences and then each set of extract made available successively. The contents are linked to youtube and the MOOC website: http://mooc.pdach.ch/index.php/Moocvideos.

Advanced online course

After the webinars an e-learning platform gives you the opportunity to enhance the acquired knowledge. For this purpose the e-learning platform provides comprehensive references, which are regularly updated and amended during the MOOCs.

Instructions for the Login

Target Audience

The MOOC is aimed at anyone involved in the fields of culture and/or media, whereby the focus is clearly set on rather classical art works. The core aim is to address questions on conservation.

Condition of participation

Access is free of charge, no previous knowledge required. It is solely your decision when and what you look up online and how actively you want take part.

Course registration and enrolment is now open. Enrolled users will receive timely reminders on webinars and will be updated and informed of any alterations.

Additional Information

Courses are held in English.

Announcement_engl

http://mooc.pdach.ch

Quelle: http://dhd-blog.org/?p=3504

Allgemein, Content Analysis, DARIAH-DE, Forschung (Methode), Lehre und Ausbildung, Markup Languages, NLP, POS, Tools, Tutorial

Explore, play, analyse your corpus with TXM

17. April 2014 Keine Kommentare

A short introduction of TXM by José Calvo and Silvia Gutiérrez

On Feburary 6-7, 2014, the Department for Literary Computing, Würzburg University, organized a DARIAH-DE Workshop called “Introduction to the TXM Content Analysis Platform“. The workshop leader was Serge Heiden (ENS-Lyon) who is in charge of the conceptualizing and implementing TXM at the ICAR Laboratory in France.

The workshop included a brief explanation of TXM’s background, but it concentrated on a very practical approach. We learned about the “Corpora options” (that is what you can know about your corpus: POS descriptions, text navigation), but also what you can do with it: find Key Words In Context (KWIC), retrieve Parts of Speech, and moreover how you can analyse these results querying for the Most Frequent Words or the cooccurrences.

In the evening of day one, we got an overview of the state of art of the use of “Natural Language Processing for Historical Texts” in a keynote by Michael Piotrowski (IEG Mainz). First of all, he started by defining Historical Texts as all those texts that will bring major problems to NLP. In order to clarify these definitions, Dr. Piotrowski listed some of the greatest difficulties:

Medium and integrity: we have to remember that in order to analyse an old script that was written in clay tablets or marble, it is compulsory to first find a way to transfer this information into a digital format (not an easy task); plus: some texts are defective or unclear, and transcriptions may introduce new errors
Language, writing system and spelling: many of the historical texts were written in extinct languages or variants different from today’s variants; as for the writing system, the many abbreviation forms and the variety of typefaces are more or less problematic; finally, we should not forget the little problem of non-standardized spelling!
State of art: Historical languages are less-resourced-languages, there are few texts available, and NLP for historical languages is carried out in specific projects; that is, there are no common standards and everyone has to start from zero.

Not to discourage his public, he then offered an overview of what can be done: Part-of-speech tagging. Creating a tagger for a historical language can be done with the the following methods:

From scratch: manually annotating your text
Using a modern tagger and manually correcting all errors
Modernizing spelling
Bootstraping POS tagger (with many versions of the same text, like the Bible)

Now let’s get back to the TXM workshop. In this post, you will find a brief practical introduction to this tool. We will provide you with a rough idea of what is this software about and what you can do with it. If you would like to learn more, do check the links we have shared towards the end of this post. By the way, all words marked with a little * are explained at the end, in the “Vocabulary” section.

What is TXM?

This software is at the juncture of linguistics and scholarly editing and it’s made to help scholars analyse the content of any kind of digital text (Unicode encoded raw texts or XML/TEI tagged texts).

To get to know more about the TXM background, don’t miss Serge Heiden’s Workshop slides:

TXM background from slheiden

Where can I work with it?

You may work on the desktop (download page) or online version of the tool. Both platforms have advantages and disadvantages. The online version allows you to start the work without downloading or installing anything, and share your corpora with other colleagues. With the desktop version, you can easily lemmatize and analyse the Parts of Speech (POS*) of your own texts.

So that you can get a better idea of the way it works, we’ll guide you with some practical examples. Say you want to search for the lemma politics on the “Brown Corpus*. First you have to open the Index option:

Then you use the query box to type in the query, using the following structure from the CQL* query language: [enlemma=“politics”]. In the desktop version, the results will look as follows (the web version is very similar):

What can I do with TXM?

Explore your corpus

Corpora options

On the first column of both interfaces there’s a list of the corpora you can work with (in this case DISCOURS, GRAAL, BROWN). When you click with the right button of your mouse on one of your corpora, you will see a list of icons:

These are the main tools of TXM and you will use one of these to analyse your corpus in different ways.

Corpus description (Dimensions)

Before you start with the fun, you should click the “Dimensions” option and have a look at some general information about the corpus (number of words, properties, and structural units, as well as the lexical and structural units properties). This information is richer in the desktop version:

Text navigation

A very practical TXM feature is the text display. If you wish to open a list of the corpus’ elements, you just have to click on the book icon (called “Texts” in the online version and “Open edition” in the other). A list like the following will be shown:

Moreover, if you click on the book icon in the “edition” column, TXM will open a readable version of our text:

Play with your corpus

Key Words In Context (KWIC)

A very typical visualization of a corpus is the so called KWIC view, which you have already seen displayed in the politics lemma example.

With TXM you can sort the results using different criteria organizing them according to the right or left context of your word, the word form, etc; besides, you can choose which elements you want to visualize. Say you’re searching for collocations of present as an adjective and NOT the data related to the noun nor the verb form (to present). First of all you need to go to the INDEX.

Once you open this, you can set the options in the “Keyword” column and visualize the grammatical category along with the word form. Then you type “JJ_present”, where “JJ” means “adjective” and “present” is the verb form, so that only those instances of the graphical form present are selected which are adjectives. It is also possible to order this data by different criteria.

As you can see in the next screenshot, you are looking for the lemma present. Therefore, you should set the first “Sort keys” menu to “Left context”, and the second one to “Keyword”; what you’re saying to the software is that you want all the examples sorted by the Left context as a first criteria and the Keyword as a second. In the “Keyword” > “View” menu we have set “enpos, word”. With that we are ordering TXM to show us not just the word form, but also the POS. That is why we see the keywords as “VVN_present” (that means, present as a verb) or JJ_present (present as an adjective):

Parts of Speech

Another way to display specific words according to their POS can be run by using the Index tool (A|Z icon), from a lexicologist point of view one the most interesting options of TXM. If you search again for the lemma present and in the properties box, you chose to see not only the word form but the POS as well, TXM will tell you the frequency, word form and POS of each different word form found in the corpus:

If you only want the word forms of the verb to present, you can add the POS information to the query: [enlemma=“present” & enpos=“VV.*”]

These index can able to create lists of n-grams. Let’s search for the most frequent words that appear after the lemma present:

Quantative analysis

Most Frequent Words

To query something you have to have a specific question and know some basic information, for instance: in which language is the corpus? A way to have a general idea about the texts is the Lexicon option, the icon with AZ both on white background. When you click on it, you will see a list of the most frequent word forms:

You can change the settings of the query and ask to count not the word forms but the lemmas. In that case the verb to be climbs up some positions, now that is, are, were, been etc. count as one single unity:

Coocurrences

Another quantitative analysis concerns the coocurrences, that is, the words (or other unities) that frequently appear close to a specific word (or to other unities). Unlike n-grams, coocurrences do not have to appear exactly after or before the unity, they just have to be somewhere close to it.

The Brown corpus was compiled in the 1960s in the United States, the main years of the Cold War. So let’s see the vocabulary related to the words United States and which one to Soviet Union:

Progression

Another statistical option that exists on the Desktop version is the Progression (icon with an arrow). This option helps visualize how many times a unity appears in a corpus or a text. This might be interesting to see the progress of a word between two dates or see the development of a word in the different parts of a text.

For the next example, the text of Bram Stocker’s novel Dracula was imported (the version used is from the University of Adelaide). With the information of the chapters kept in XML elements, you can look for the name of the main characters and see how many times and where they appear. The next screen-shot shows the complete query:

To understand the next graphic, you have to keep in mind that if the lines ascends, that means the name has been mentioned; if the line keeps going horizontally, it means the name didn’t appear any more.

As you can see, the Count Dracula (yellow) is the most mentioned name in the first four chapters, but it almost disappears towards the 17th chapter. In this gap, Lucy (blue) becomes the main character and, from the 9th chapter, the Professor van Helsing (red) takes the “leading” role. It is also remarkable that this last character is not only the most frequent, but the most stable.

Sub-corpora and partitions

You can divide your corpus into two options: sub-corpora and partitions. With a sub-corpus you can choose some texts from a corpus and work with them. With the partition, you can split the corpus into more than one part and easily compare the results of the different parts. On the next screenshot, you have the menu where a Partition called “Fiction and Press partition” is being created, using the XML “text” and the property “type” to choose which kind of text is wanted. This partition will have two parts: one called “Fiction” and the other one called “Press” and each of it will contain the respective type of texts.

Useful links

“A gentle introduction to TXM key concepts in 90 minutes” by Serge Heiden: http://sourceforge.net/projects/txm/files/documentation/IQLA-GIAT%202013%20TXM-workshop.pdf/download

Tutorial video introducing TXM 0.4.6 (WARNING: the software, specially it’s surface, is now very different): http://textometrie.ens-lyon.fr/IMG/html/intro-discours.htm

TXM background http://fr.slideshare.net/slheiden/txm-background

TXM import process http://fr.slideshare.net/slheiden/txm-import-process

Vocabulary

Brown Corpus

The Brown corpus consists of 500 English-language texts, with roughly one million words, compiled from works published in the United States in 1961. You can learn more about it here.

CQL

TXM uses an underlying Contextual Query Language, which is a formal system for representing queries to information retrieval systems such as web indexes, bibliographic catalogues and museum collection information. More information in the official web-page: http://www.loc.gov/standards/sru/cql/

POS

Here is a useful alphabetical list of part-of-speech tags used in the Penn Treebank Project (tag and description): https://www.ling.upenn.edu/courses/Fall_2003/ling001/penn_treebank_pos.html

Quelle: http://dhd-blog.org/?p=3384

« Zurück 1 … 7 8 9 10 Weiter »