Semantische Technologien

semantic-media-web

Die Fachtagung “Semantische Technologien - Verwertungsstrategien und Konvergenz von Metadaten” befasste sich vom 26. bis 27. September 2013 mit der Nutzbarkeit semantischer Technologien für die Kultur- und Medienbranche. Thematisiert wurden Institutionen wie Verlage, Museen und Bibliotheken sowie die Bereiche Projektdokumentationen, Werbung und Marketing.

Der rückblickende Tagungsbericht stellt die zentralen Fragestellungen, Probleme und Chancen des semantischen Internet dar.

 

Quelle: http://dhd-blog.org/?p=2447

Weiterlesen

Wissen suchen, finden und vernetzen – die Fachtagung “Semantische Technologien“ im Rückblick

Titelbild "Semantic Media Web"

Titelbild “Semantic Media Web”

Unter dem Titel „Verwertungsstrategien und Konvergenz von Metadaten” organisierten das deutsch-österreichische W3C-Büro und die Xinnovations e. V. in Zusammenarbeit mit dem Innovationsforum Semantic Media Web vom 26. bis 27. September 2013 in Berlin die Fachtagung “Semantische Technologien”, die sich mit der Nutzbarkeit semantischer Technologien für die Kultur- und Medienbranche befasste. Dabei waren Institutionen im Allgemeinen, wie Verlage, Museen und Bibliotheken, ebenso Thema wie die Bereiche Projektdokumentationen, Werbung und Marketing im Speziellen.

Der Umfang des im Internet verfügbaren Fachwissens ist in den letzten Jahren immens gewachsen, jedoch zu wenig sortiert und aufbereitet, um gut damit arbeiten zu können. Hier setzen die Technologien des semantischen Internet, genannt Web 3.0, an. Sie sollen Inhalte jeglicher Art durch Metadaten kategorisieren und in Hierarchien einordnen, um eine (möglichst einheitliche) Verknüpfung des verfügbaren Wissens und damit dessen bessere Zugänglichkeit und Anwendbarkeit zu ermöglichen.

Zentrale Fragestellung der Konferenz war es, die Möglichkeiten der Umsetzung und Nutzung solcher semantischer Daten, die Beziehungen, Kontexte und Bedeutungen von Daten erzeugen, für Kultur- und Medienbetriebe aufzuzeigen. Genutzt wird deren Aufbereitung z.B. bereits von der Deutschen Nationalbibliothek und dem Bundesarchiv, um ihre Wissensressourcen im Internet zur Verfügung zu stellen und Recherchen zu erleichtern. Die Querverlinkungen helfen hier, sich Überblick über komplexe Themenfelder und verwandte Beiträge, Bücher oder Dokumente zu verschaffen. Auch stehen die Digitalisierung von Museums- oder Archivsammlungen, wirtschaftliche Bereiche wie Bestandsaufnahmen und Vertrieb sowie bei Bibliotheken die Aufbereitung für Online-Kataloge im Mittelpunkt. Hier bringt die Nutzung semantischer Metadaten viele Vorteile und Vereinfachungen des Workflows mit sich, wie die Referenten der Fachkonferenz darlegten. Zu ihnen gehörten Alexander Haffner (Deutsche Nationalbibliothek) und Ina Blümel (TIB Hannover) als Bibliotheksvertreter, Dr. Jana Kittelmann (Stiftung Fürst-Pückler-Museum Park & Schloss Branitz) mit dem Schwerpunkt Archiv, Antoine Isaac als Stellvertreter von Europeana sowie Bettina de Keijzer (Verlag de Gruyter), Steffen Meier (Verlag Eugen Ulmer, Arbeitskreis elektronisches Publizieren des Börsenverein des Deutschen Buchhandels) und Ronald Schild (Marketing- und Verlagsservice des Buchhandels GmbH), die sich mit dem Thema Verlag & Buchhandel beschäftigen.

In den Beiträgen und Diskussionen wurde deutlich, dass die übergreifende Verknüpfung semantisch aufbereiteter Daten über einzelne Firmen und Institutionen hinaus noch kaum Anwendung findet. Dabei sollen neben basic data wie Autor oder Umfang eines Buches die Inhalte selbst systematisiert werden, um die Nutzung von weiterreichenden, sogenannten enhanced Data, zu ermöglichen und zum Ausgleich Wissen, Kundensympathie oder wirtschaftlichen Output zurückzubekommen. So machte Roland Schild deutlich, dass Verlage z.b. ihren Service im Social Web mit Semantik verbessern können, um ihren Kunden bei der Suche nach ähnlichen Produkten und auf diese Weise sich selbst bei der Umsatzsteigerung zu helfen. Hierfür wird das Semantic Web bisher aber kaum genutzt.

Zugleich gibt es zwischen Verlagen und Bibliotheken nur wenig Zusammenarbeit in Bezug auf die einheitliche Zuordnung von Büchern und deren Inhalten zu festen semantischen Begrifflichkeiten oder Kategoriesystemen. Gleiches gilt für Archive oder Museen, die ihre Sammlungen digitalisieren. Auch sie behandeln die weiteren Kontexte der Exponate meist nur marginal und verwenden keine über-institutionellen semantischen Begriffssysteme. Solche könnten helfen, beispielsweise passende Stücke für Sonderausstellungen oder fachliche Zusatzinformationen zu Vergleichsbeispielen oder historischen Kontexten zu finden. Interessant können Metadaten auch für die Dokumentation von Projektprozessen sein, um die Auswertung und das Vermeiden von Fehlern zu verbessern. Beispielhaft präsentierte Prof. Dr.-Ing. Ernesto De Luca hierfür das Projekt SemRes, das Semantic für die tägliche Arbeit von Restauratoren nutzbar macht, um diese zugunsten der späteren Nachvollziehbarkeit dauerhaft zugänglich und leichter austauschbar zu gestalten.

Für die Erstellung und Etablierung solcher Schlagwort-Hierarchien, die allgemeingültig sein und damit von Bibliotheken, Verlagen, Museen und Wissenschaftlern gleichermaßen verstanden und genutzt werden sollen, gibt es bereits Ansätze. U.a. von W3C (World Wide Web Consortium) wurden grundlegende semantische Systeme entwickelt, die jede Institution für die eigenen Projekte nutzen kann. Forschungen kommen bisher vor allem aus Philologie und Linguistik und setzen sich mit dem Stand von Mehrsprachigkeit, Begriffsbedeutungen und eindeutiger Verständlichkeit auseinander, stellen in Bezug auf computerlinguistische Semantik derzeit aber noch ein recht kleines Forschungsfeld dar. Ein Desiderat sind die Auseinandersetzung mit diesem Problem in den einzelnen Fachbereichen und die Entwicklung von entsprechenden Thesauri. Hier ist es den Fachwissenschaftlern besser möglich, ihr Wissen zu systematisieren, als Experten aus der Sprachforschung oder Informatik ohne umfangreiche Kenntnisse der jeweilgen Wissenschaft.

Nutzbar ist semantische Aufbereitung auch für Bilder und Videos im Kontext von Marketing und Medien, Marken- und Konkurrenzanalysen. Dies ist für jede Institution interessant, die Videos oder Fotos für Ausstellungen oder PR benutzt. Wenn sie inhaltlich Ausstellungen, Aufführungen oder Publikationen zugeordnet werden können, erhöht sich ihre Nutzbarkeit. Beispielhaft präsentierte Felix Daub von Klickfilm die semantische Verknüpfung von Inhalten eines Videos mit Produkten oder Websites, um interessierte Kunden direkt anzusprechen. Dies kann mit Büchern ebenso geschehen, wie mit Sehenswürdigkeiten, Kunst oder historischen Hintergrundinformationen. Interessant sind auch semantische Websites, wie sie Dr. Thomas Hoppe von der Ontonym GmbH in der Theorie und Armin Berger von der 3pc GmbH in der Praxis präsentierten. Hierbei werden die Inhalte über Schlagworte und Kontexte in Erzählsträngen dargestellt und dem Besucher die Möglichkeit gegeben, diese je nach den eigenen Interessen selbst zu erforschen. Dieses Storytelling eignet sich besonders für Kulturinstitutionen, die damit ihre eigene Geschichte ebenso wie die Hintergründe einzelner Ausstellungen, Stücke oder Werke umsetzen können. Zugleich können auch bei Apps mehrdimensionale Datenstrukturierungen anschaulich gemacht und Zusammenhänge über mehrere Punkte erklärt werden. Diese Möglichkeiten sind aber noch in der Entwicklung begriffen und vor allem in Bezug auf dynamische, regelmäßige befüllte Webseiten noch nicht ausgereift.

Insgesamt machte die Tagung die Nutzungsmöglichkeiten des Semantic Web für Kulturunternehmen zwar deutlich, zeigte aber auch die noch vielfach bestehenden Probleme auf. Dies liegen derzeit primär in der Entwicklung von einheitlichen Hierarchien und Begrifflichkeiten sowie der daran geknüpften automatisierten Aufbereitung semantischer Daten und Verknüpfung der Projekte einzelner Institutionen. Auch die Aufbereitung und Anwendbarkeit semantischer Daten in Forschungs- oder Kultureinrichtungen für spezifische Inhalte und nicht-textuelle Digitalisate stellen noch große Komplikationen dar und sind ohne zusätzliches Budget und informatische Fachkenntnisse bisher kaum umsetzbar. Deutlich wurde dies an den Teilnehmern und Diskussionen der Fachtagung, die sich vorrangig mit Computerlinguistik und Programmierung beschäftigten. So wurde bereits das Web 4.0 als Pragmatic Web thematisiert, während es gerade in den Kultur- und Geisteswissenschaften vielfach noch Probleme beim richtigen Umgang mit dem Web 2.0 und größere Schwierigkeiten beim Zugang zur Anwendbarkeit des Web 3.0 gibt.

Quelle: http://kristinoswald.hypotheses.org/1102

Weiterlesen

Doktorandenstelle in Computerlinguistik/Informatik (3 Jahre, Universität Zürich)

Die Rechtsquellenstiftung des Schweizerischen Juristenvereins sucht

eine Doktorandin oder einen Doktoranden,

die/der in einem kleinen, interdisziplinären Team eine Datenbank zu historischen Personen, Orten und Begriffen – und Beziehungen zwischen ihnen – mit Verweisen auf die Quellentexte der Sammlung Schweizerischer Rechtsquellen (SSRQ) entwickelt.

In der Sammlung wird rechtshistorisches Quellenmaterial aus allen Teilen der Schweiz vom Mittelalter bis in die Frühe Neuzeit (1798) in den verschiedenen Landessprachen sowie Latein ediert. Die Daten der SSRQ zeichnen sich durch ihre Komplexität aus: Zunächst hat praktisch jede Entität mehrere Namen bzw. Namensvarianten. Zweitens haben viele Daten eine zeitliche Dimension. Drittens gibt es eine Vielzahl von Beziehungen zwischen allen Entitäten. Die Datenbank soll es ermöglichen, alle relevanten Informationen in strukturierter Form zu erfassen und abzufragen.

Eine wissenschaftliche Auseinandersetzung mit diesem Themenkreis mit dem Ziel der Promotion wird erwartet. Die Finanzen sind für eine dreijährige Projektzeit gesichert.

Qualifikationen:

  • Master oder Diplom in Computerlinguistik, Informatik oder einem verwandtem Fach
  • Sehr gute Programmierkenntnisse
  • Sprachen: Deutsch, Englisch; weitere (Landes-)Sprachen der Schweiz sind ein großes Plus
  • Kenntnisse von Semantic Web-Technologien, Erfahrung mit kontrollierten Vokabularen, Ontologien und Thesauri sowie Interesse an historischer Forschung sind von Vorteil

Aufgaben:

  • Mitarbeit an der Erstellung eines Prototypen und der Definition der Anforderungen
  • Datenmodellierung
  • Spezifikation der Benutzungsoberfläche
  • Evaluation und Auswahl der zu verwendenden Technologien
  • Implementierung
  • Import der vorhanden Daten, Tests

Arbeitgeberleistungen:

  • Doktorandenlohn entsprechend den Vorgaben des Schweizerischen Nationalfonds (42’000 – 48’000 CHF pro Jahr)
  • Weiterbildung an Konferenzen oder Summer Schools werden unterstützt
  • Kleines, hochmotiviertes, interdisziplinäres Team; Anbindung an die Institute für Computerlinguistik und Informatik
  • Hoher Lebensstandard in Zürich, einer der attraktivsten Städte Europas

Vorgesehener Projektbeginn: Sofort oder nach Vereinbarung

Bewerbungsunterlagen: CV, Zeugnisse und Verzeichnis der absolvierten Kurse senden Sie bitte an Dr. Pascale Sutter, Leiterin der Rechtsquellenstiftung (pascale.sutter@ssrq-sds-fds.ch), die Ihnen auch für weitere Informationen gerne zur Verfügung steht.

Bewerbungsfrist: Ab sofort, Dossiers werden laufend geprüft

Arbeitgeber: Rechtsquellenstiftung des Schweizerischen Juristenvereins, in enger Zusammenarbeit mit Professor Abraham Bernstein, Institut für Informatik UZH, und Professor Martin Volk, Institut für Computerlinguistik UZH

Aufgabe: Realisierung einer Datenbank zu historischen
Personen, Orten und Begriffen

Arbeitsort: Universität Zürich, Zürich, Schweiz

PDF-Version der Ausschreibung

Quelle: http://dhd-blog.org/?p=1655

Weiterlesen

Semantic Web – das Wissen der Welt vernetzten

Informationen zu sammeln ist evolutionär, ja beinahe als eine jener Eigenschaften des Menschen anzusehen, die ihn einzigartig machen. Je mehr Informationen über seine Umwelt der Mensch hatte, desto größer waren seine Chancen, in einer noch nicht kontrollierbaren Welt zu überleben. … Weiterlesen

Quelle: http://kristinoswald.hypotheses.org/733

Weiterlesen