DH-Kolloquium an der BBAW, 11.10.2019, Noah Bubenhofer: Word Embeddings – Diskurslinguistische Perspektiven auf distributionelle Semantik

Im Rahmen des DH-Kolloquiums an der BBAW möchten wir Sie herzlich zum nächsten Termin am Freitag, dem 11. Oktober 2019, 17 Uhr s.t. bis 19 Uhr (Konferenzraum 1), einladen:


Prof. Dr. Noah Bubenhofer (Deutsches Seminar der Universität Zürich, Deutsche Sprachwissenschaft):
„Word Embeddings Diskurslinguistische Perspektiven auf distributionelle Semantik“

Mit Word-Embedding-Modellen, die dem Paradigma distributioneller Semantik folgen, stehen seit einiger Zeit Methoden zur Verfügung, um semantische Räume zu modellieren. Die Methoden fußen auf bereits in den 50er-Jahren eingeführten gebrauchssemantischen Theorien, die sich aber erst in jüngster Zeit entfalten können, da ausreichend große Textmengen und die nötige Rechenkraft für neuronales maschinelles Lernen zur Verfügung stehen.

[...]

Quelle: https://dhd-blog.org/?p=12247

Weiterlesen

Stellenausschreibung: Universitätsassistent/in Digitale Linguistik, Universität Wien

Am Institut für Germanistik der Universität Wien wird im Arbeitsteam von Prof. Lenz u.a. im Rahmen des SFB-Projekts „Deutsch in Österreich“ eine prae-doc Forschungskraft gesucht.

Dauer der Befristung: 4 Jahre

Beschäftigungsausmaß: 30 Stunden/Woche

Einstufung gemäß Kollektivvertrag: §48 VwGr. B1 Grundstufe (praedoc)
Darüber hinaus können anrechenbare Berufserfahrungen die Einstufung und damit das Entgelt bestimmen.



[...]

Quelle: https://dhd-blog.org/?p=11518

Weiterlesen

Stellenausschreibung: Postdoc Computerlinguistik oder Korpuslinguistik mit Fokus Latein

The Faculty of Arts of the University of Lausanne (UNIL) invites applications for a Postdoctoral Researcher (SNSF) in Computational Linguistics or Corpus Linguistics with a focus on Latin in the Department of Language and Information Sciences.

  • Expected start date: 1st March 2019 (or to be agreed)
  • Contract length: 4 years
  • Activity rate: 75%
  • Workplace: University of Lausanne, Campus Dorigny

The successful candidate will work on the project A world of possibilities. Modal pathways on the extra-long period of time: the diachrony of modality in the Latin language funded by the Swiss National Science Foundation (project no. PP00P1_176778).

The team will consist of the PI and of a PhD student in addition to the postdoc. The main tasks of the postdoc researcher will be:

  • the development of suitable annotation schemes
  • the creation and development of a database and of its interface
  • the creation and maintenance of the website of the project
  • the annotation of Latin texts
  • the collaboration at various research activities connected with the project (publications and other ways of disseminating results)

Your profile

PhD or equivalent qualification in Linguistics or Computer Science with a specialisation in Computational Linguistics or Corpus Linguistics.

[...]

Quelle: https://dhd-blog.org/?p=10838

Weiterlesen

Tagungsbericht DHd 2016: „Vorträge_5b: Digitale Edition III“

Als Masterstudentin der Computerlinguistik und Texttechnologie an der Justus-Liebig-Universität Gießen habe ich an der diesjährigen DHd-Tagung in Leipzig teilgenommen, die zum Thema „Modellierung – Vernetzung – Visualisierung: Die Digital Humanities als fächerübergreifendes Forschungsparadigma“ vom 7. bis 12. März 2016 über 460 Teilnehmer anzog. In diesem Beitrag möchte ich von meinen Eindrücken im Hinblick auf die Vortragsreihe „Vorträge_5b: Digitale Edition III“ vom 11. März 2016 berichten, in der drei Beiträge aus den Bereichen der Korpuslinguistik, der Digitalen Editorik und der Geschichtswissenschaften vorgestellt wurden. Der Fokus lag bei allen drei Vorträgen auf den Möglichkeiten der Arbeit mit literarischen wie historischen Textkorpora und digitalen Editionen in Infrastrukturen. Zunächst wurde der jeweilige Gegenstand und die entsprechende Infrastruktur skizziert und anschließend ein Anwendungsfall samt Live-Demonstration simuliert, bei dem die benutzten Tools und die gezeigten Arbeitsumgebungen unter die Lupe genommen wurden. Alle drei Vorträge stellten interessante und hilfreiche Tools vor, die mitunter auch innovative, explorative Zugänge zu Textkorpora ermöglichen. In den folgende drei Absätzen gehe ich auf jeden einzelnen Vortrag ein und hebe solche Aspekte hervor, die für mich persönlich ein Zugewinn waren.



[...]

Quelle: http://dhd-blog.org/?p=6779

Weiterlesen

Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften (30.10.2015, Berlin)

via Lothar Lemnitzer:

Korpora werden in den Geisteswissenschaften rege genutzt. Im BMBF-Verbundprojekt KobRA (Korpus-basierte Recherche und Analyse) arbeiten Informatik, Linguistik und Sprachtechnologie zusammen an Verfahren, die das Arbeiten mit Korpora qualitativ verbessern.

Die Tagung „Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften“ stellt die Ergebnisse des Projekts KobRA vor und diskutiert Perspektiven.

Datum und Zeit: 30. Oktober 2015, 9:30 bis 18:30 Uhr
Ort: Berlin-Brandenburgische Akademie der Wissenschaften (BBAW), Akademiegebäude am Gendarmenmarkt, Einsteinsaal, Jägerstrasse 22/23, 10117 Berlin

Anmeldung zum 25. Oktober 2015:
Online-Formular zur Anmeldung für die KobRA-Abschlusstagung (die Teilnahme ist kostenlos)



[...]

Quelle: http://dhd-blog.org/?p=5716

Weiterlesen

Workshop zu korpuslinguistischen Methoden am 7./8. Oktober in Berlin

Die Forschung mit korpuslinguistischen Methoden innerhalb geisteswissenschaftlicher Disziplinen stellt neben der Erstellung der Ressourcen auch Aufgaben hinsichtlich der Datenverarbeitung und Konvertierung, deren Analyse, Speicherung und des Zugriffs.

Das LAUDATIO-Projekt gibt zu diesen Themen einen Workshop vom 07.10.-08.10.2014 an der Humboldt-Universität zu Berlin ausgerichtet vom Computer- und Medienservice und dem Lehrstuhl für Korpuslinguistik und Morphologie. Der Workshop richtet sich an Anwender und Entwickler von korpuslinguistischen Methoden, Werkzeugen und Software. Wir stellen u.a. das LAUDATIO-Repository, das Such- und Visualisierungstool ANNIS und das Konverter-Framework SaltNPepper vor.

Der Workshop ist auf 45 Teilnehmer begrenzt und ist anmeldepflichtig. Für die Pausenverpflegung erheben wir eine kleine Teilnehmergebühr von 16,33 €.

Alle Informationen zum Workshop und zur Registrierung finden Sie auf

http://www.laudatio-repository.org/laudatio/workshop-2014/

Quelle: http://dhd-blog.org/?p=4033

Weiterlesen

Wiss. DH MitarbeiterIn im Projekt “Textdatenbank und Wörterbuch des Klassischen Maya” (E 13 TV-L, 75%), Universität Bonn

An der Rheinischen Friedrich-Wilhelms-Universität Bonn, Institut für Archäologie und Kulturanthropologie, Abteilung für Altamerikanistik, ist im Rahmen des Drittmittelprojekts „Textdatenbank und Wörterbuch des Klassischen Maya“ (NRW Akademie der Wissenschaften und der Künste, Laufzeit 2014 bis voraussichtlich 2029) ab 1. Juni 2014 die zunächst bis zum 31.12.2016 befristete Stelle (E13 TV-L, 75%) als

informationswissenschaftlicher DH-Mitarbeiter (w / m)

mit der Option auf Verlängerung zu besetzen.

Das von Prof. Dr. Nikolai Grube geleitete Langzeitvorhaben will auf der Grundlage einer Dokumentation der bisherigen Forschung und der digitalen Erschließung des gesamten Schriftkorpus die Grundlage für die Analyse des Wortschatzes und der Grammatik der Schriftsprache und damit zur vollständigen Entzifferung der Maya-Hieroglyphenschrift legen. Die technische Umsetzung baut auf TextGrid auf, einer Virtuellen Forschungsumgebung (VFU) für die Geisteswissenschaften mit Repository für geisteswissenschaftliche Forschungsdaten. Das Vorhaben wird mit der Staats- und Universitätsbibliothek Göttingen (TextGrid) sowie der Universitäts- und Landesbibliothek Bonn durchgeführt (Visual Library).

Arbeitsaufgaben:

  • Koordination und Umsetzung der informationstechnologischen Zusammenarbeit zwischen der Arbeitstelle, der VFU TextGrid und Visual Library
  • Konzeption, Erstellung und Anpassung der Datenbanksysteme und deren Einbindung in TextGrid (Literaturdatenbank, Bilddatenbank, Wörterbuch-Datenbank usw.)
  • Mitwirkung bei der Entwicklung einer Raum-Zeit-Visualisierung der Forschungsdaten
  • Mitentwicklung von Programmen zur automatisierten Berechnung und Rekonstruktion von Maya-Kalenderdaten sowie Anpassung bzw. Programmierung korpuslinguistischer und lexikographischer Anwendungen
  • Automatisierte Unterstützung von Forschungsprozessen (z.B. Extrahieren von Bildelementen und deren Einbindung in die VFU)
  • Einrichtung von Schnittstellen/Interfaces (REST, SOAP, OAI)
  • Betreuung des Dateningests und technische Unterweisung der wissenschaftlichen Mitarbeiter

Voraussetzungen:

  • Wissenschaftlicher Hochschulabschluss mit ausgewiesenen IT-Kenntnissen
  • Kenntnisse im Umgang mit digitalen Forschungsdaten
  • Sehr gute Kenntnisse in der XML-Familie (XML, insbesondere XML TEI, XSLT, xPath, eXist etc.)
  • Kenntnisse in der Datenmodellierung unter Berücksichtigung von Technologien des Semantic Webs (RDF/RDFS, SPARQL)
  • Kenntnisse von Digitalisierungsworkflows und OCR Verfahren
  • Kenntnisse gängiger Webtechnologien (HTML, CSS, JavaScript, Linux)
  • Gute organisatorische Fähigkeiten, gutes Zeitmanagement
  • Hohe Kommunikationskompetenz, sehr gute Teamfähigkeit, gute Englischkenntnisse und die Bereitschaft zur Auseinandersetzung mit Maya-Inschriftenforschung

Chancengleichheit ist Bestandteil unserer Personalpolitik. Schwerbehinderte werden bei gleicher Eignung bevorzugt.

Informationen zum Projekt finden Sie unter: www.iae.uni-bonn.de. Bei Fragen wenden Sie sich bitte an Herrn Dr. Christian Prager (0228/73-62307 oder cprager (at) uni-bonn.de). Wenn Sie sich für diese Position interessieren, senden Sie bitte Ihre vollständigen und aussagekräftigen Bewerbungsunterlagen bis zum 25. April 2014 an Prof. Dr. Nikolai Grube, Abteilung für Altamerikanistik, Oxfordstraße 15, 53111 Bonn, Kennzeichen TWKM, oder per E-Mail mit dem Betreff „Bewerbung TWKM“ an: idiom (at) uni-bonn.de

Bewerbungsunterlagen werden nur dann zurückgesandt, wenn ein adressierter und ausreichend frankierter Rückumschlag beigefügt ist.

Quelle: http://dhd-blog.org/?p=3230

Weiterlesen

DARIAH-DE Workshop “Introduction to the TXM Content Analysis Platform”

The Department for Literary Computing, Würzburg University, will organize a DARIAH-DE Workshop called “Introduction to the TXM Content Analysis Platform”.

Workshop outline

The objective of the “Introduction to TXM” tutorial is to introduce the participants to the methodology of text analysis through working with the TXM software directly on their own laptop computers. At the end of the tutorial, the participants will be able to input their own textual corpora (Unicode encoded raw texts or XML/TEI tagged texts) into TXM and to analyze them with the panel of content analysis tools available: word patterns frequency lists, kwic concordances and text browsing, rich full text search engine syntax (allowing to express various sequences of word forms, part of speech and lemma combinations constrained by XML structures), statistically specific sub-corpus vocabulary analysis, statistical collocation analysis, etc.). The portal version of TXM, allowing the on line access and analysis of corpora, will also be introduced.

Basic information

  • Time: February 6-7, 2014
  • Place: Würzburg University (details tba)
  • Workshop leader: Serge Heiden (Lyon)
  • Local organizer: Christof Schöch (Würzburg)

For further information:

Practical matters

The workshop is aimed at younger as well as experienced scholars from the humanities dealing with textual data. It is being organized by the Department for Literary Computing at Würzburg University, Germany, under the auspices of the DARIAH-DE initiative. It will be held by Serge Heiden, leader of the TXM project. It will take place on Feb. 6-7, 2014 at Würzburg University.

The maximum number of participants is limited to 15 and places will be filled on a first-come first-serve basis. The deadline for applications is January 20th, 2014. There is no fee for participating in this event. You will need to bring along your own laptop computer. Access to the internet will be available. Please contact Dr. Christof Schöch for further details and to sign up for the event at christof.schoech@uni-wuerzburg.de.

Preliminary programme

Thursday, February 6

  • 13:30-14:00 – Welcome
  • 14:00-15:30 – Introduction to TXM
  • 15:30-16:00 – Coffee break
  • 16:00-17:30 – Hands-on Session 1
  • 18:00-19:15 – Lecture by invited speaker (tba)
  • 20:00- – Dinner

Friday, Feb 7

  • 9:00-11:00 – Hands-on Session 2
  • 11:00-11:30 – Coffee break
  • 11:30-13:00 – Hands-on Session 3
  • 13:00-13:30 – Final discussion and farewell

Note: This event is being organized by DARIAH-DE with funding provided by the German Federal Ministry of Education and Research (BMBF) under the identifier 01UG1110J.

Quelle: http://dhd-blog.org/?p=2782

Weiterlesen