Titelbild “Semantic Media Web”
Unter dem Titel „Verwertungsstrategien und Konvergenz von Metadaten” organisierten das deutsch-österreichische W3C-Büro und die Xinnovations e. V. in Zusammenarbeit mit dem Innovationsforum Semantic Media Web vom 26. bis 27. September 2013 in Berlin die Fachtagung “Semantische Technologien”, die sich mit der Nutzbarkeit semantischer Technologien für die Kultur- und Medienbranche befasste. Dabei waren Institutionen im Allgemeinen, wie Verlage, Museen und Bibliotheken, ebenso Thema wie die Bereiche Projektdokumentationen, Werbung und Marketing im Speziellen.
Der Umfang des im Internet verfügbaren Fachwissens ist in den letzten Jahren immens gewachsen, jedoch zu wenig sortiert und aufbereitet, um gut damit arbeiten zu können. Hier setzen die Technologien des semantischen Internet, genannt Web 3.0, an. Sie sollen Inhalte jeglicher Art durch Metadaten kategorisieren und in Hierarchien einordnen, um eine (möglichst einheitliche) Verknüpfung des verfügbaren Wissens und damit dessen bessere Zugänglichkeit und Anwendbarkeit zu ermöglichen.
Zentrale Fragestellung der Konferenz war es, die Möglichkeiten der Umsetzung und Nutzung solcher semantischer Daten, die Beziehungen, Kontexte und Bedeutungen von Daten erzeugen, für Kultur- und Medienbetriebe aufzuzeigen. Genutzt wird deren Aufbereitung z.B. bereits von der Deutschen Nationalbibliothek und dem Bundesarchiv, um ihre Wissensressourcen im Internet zur Verfügung zu stellen und Recherchen zu erleichtern. Die Querverlinkungen helfen hier, sich Überblick über komplexe Themenfelder und verwandte Beiträge, Bücher oder Dokumente zu verschaffen. Auch stehen die Digitalisierung von Museums- oder Archivsammlungen, wirtschaftliche Bereiche wie Bestandsaufnahmen und Vertrieb sowie bei Bibliotheken die Aufbereitung für Online-Kataloge im Mittelpunkt. Hier bringt die Nutzung semantischer Metadaten viele Vorteile und Vereinfachungen des Workflows mit sich, wie die Referenten der Fachkonferenz darlegten. Zu ihnen gehörten Alexander Haffner (Deutsche Nationalbibliothek) und Ina Blümel (TIB Hannover) als Bibliotheksvertreter, Dr. Jana Kittelmann (Stiftung Fürst-Pückler-Museum Park & Schloss Branitz) mit dem Schwerpunkt Archiv, Antoine Isaac als Stellvertreter von Europeana sowie Bettina de Keijzer (Verlag de Gruyter), Steffen Meier (Verlag Eugen Ulmer, Arbeitskreis elektronisches Publizieren des Börsenverein des Deutschen Buchhandels) und Ronald Schild (Marketing- und Verlagsservice des Buchhandels GmbH), die sich mit dem Thema Verlag & Buchhandel beschäftigen.
In den Beiträgen und Diskussionen wurde deutlich, dass die übergreifende Verknüpfung semantisch aufbereiteter Daten über einzelne Firmen und Institutionen hinaus noch kaum Anwendung findet. Dabei sollen neben basic data wie Autor oder Umfang eines Buches die Inhalte selbst systematisiert werden, um die Nutzung von weiterreichenden, sogenannten enhanced Data, zu ermöglichen und zum Ausgleich Wissen, Kundensympathie oder wirtschaftlichen Output zurückzubekommen. So machte Roland Schild deutlich, dass Verlage z.b. ihren Service im Social Web mit Semantik verbessern können, um ihren Kunden bei der Suche nach ähnlichen Produkten und auf diese Weise sich selbst bei der Umsatzsteigerung zu helfen. Hierfür wird das Semantic Web bisher aber kaum genutzt.
Zugleich gibt es zwischen Verlagen und Bibliotheken nur wenig Zusammenarbeit in Bezug auf die einheitliche Zuordnung von Büchern und deren Inhalten zu festen semantischen Begrifflichkeiten oder Kategoriesystemen. Gleiches gilt für Archive oder Museen, die ihre Sammlungen digitalisieren. Auch sie behandeln die weiteren Kontexte der Exponate meist nur marginal und verwenden keine über-institutionellen semantischen Begriffssysteme. Solche könnten helfen, beispielsweise passende Stücke für Sonderausstellungen oder fachliche Zusatzinformationen zu Vergleichsbeispielen oder historischen Kontexten zu finden. Interessant können Metadaten auch für die Dokumentation von Projektprozessen sein, um die Auswertung und das Vermeiden von Fehlern zu verbessern. Beispielhaft präsentierte Prof. Dr.-Ing. Ernesto De Luca hierfür das Projekt SemRes, das Semantic für die tägliche Arbeit von Restauratoren nutzbar macht, um diese zugunsten der späteren Nachvollziehbarkeit dauerhaft zugänglich und leichter austauschbar zu gestalten.
Für die Erstellung und Etablierung solcher Schlagwort-Hierarchien, die allgemeingültig sein und damit von Bibliotheken, Verlagen, Museen und Wissenschaftlern gleichermaßen verstanden und genutzt werden sollen, gibt es bereits Ansätze. U.a. von W3C (World Wide Web Consortium) wurden grundlegende semantische Systeme entwickelt, die jede Institution für die eigenen Projekte nutzen kann. Forschungen kommen bisher vor allem aus Philologie und Linguistik und setzen sich mit dem Stand von Mehrsprachigkeit, Begriffsbedeutungen und eindeutiger Verständlichkeit auseinander, stellen in Bezug auf computerlinguistische Semantik derzeit aber noch ein recht kleines Forschungsfeld dar. Ein Desiderat sind die Auseinandersetzung mit diesem Problem in den einzelnen Fachbereichen und die Entwicklung von entsprechenden Thesauri. Hier ist es den Fachwissenschaftlern besser möglich, ihr Wissen zu systematisieren, als Experten aus der Sprachforschung oder Informatik ohne umfangreiche Kenntnisse der jeweilgen Wissenschaft.
Nutzbar ist semantische Aufbereitung auch für Bilder und Videos im Kontext von Marketing und Medien, Marken- und Konkurrenzanalysen. Dies ist für jede Institution interessant, die Videos oder Fotos für Ausstellungen oder PR benutzt. Wenn sie inhaltlich Ausstellungen, Aufführungen oder Publikationen zugeordnet werden können, erhöht sich ihre Nutzbarkeit. Beispielhaft präsentierte Felix Daub von Klickfilm die semantische Verknüpfung von Inhalten eines Videos mit Produkten oder Websites, um interessierte Kunden direkt anzusprechen. Dies kann mit Büchern ebenso geschehen, wie mit Sehenswürdigkeiten, Kunst oder historischen Hintergrundinformationen. Interessant sind auch semantische Websites, wie sie Dr. Thomas Hoppe von der Ontonym GmbH in der Theorie und Armin Berger von der 3pc GmbH in der Praxis präsentierten. Hierbei werden die Inhalte über Schlagworte und Kontexte in Erzählsträngen dargestellt und dem Besucher die Möglichkeit gegeben, diese je nach den eigenen Interessen selbst zu erforschen. Dieses Storytelling eignet sich besonders für Kulturinstitutionen, die damit ihre eigene Geschichte ebenso wie die Hintergründe einzelner Ausstellungen, Stücke oder Werke umsetzen können. Zugleich können auch bei Apps mehrdimensionale Datenstrukturierungen anschaulich gemacht und Zusammenhänge über mehrere Punkte erklärt werden. Diese Möglichkeiten sind aber noch in der Entwicklung begriffen und vor allem in Bezug auf dynamische, regelmäßige befüllte Webseiten noch nicht ausgereift.
Insgesamt machte die Tagung die Nutzungsmöglichkeiten des Semantic Web für Kulturunternehmen zwar deutlich, zeigte aber auch die noch vielfach bestehenden Probleme auf. Dies liegen derzeit primär in der Entwicklung von einheitlichen Hierarchien und Begrifflichkeiten sowie der daran geknüpften automatisierten Aufbereitung semantischer Daten und Verknüpfung der Projekte einzelner Institutionen. Auch die Aufbereitung und Anwendbarkeit semantischer Daten in Forschungs- oder Kultureinrichtungen für spezifische Inhalte und nicht-textuelle Digitalisate stellen noch große Komplikationen dar und sind ohne zusätzliches Budget und informatische Fachkenntnisse bisher kaum umsetzbar. Deutlich wurde dies an den Teilnehmern und Diskussionen der Fachtagung, die sich vorrangig mit Computerlinguistik und Programmierung beschäftigten. So wurde bereits das Web 4.0 als Pragmatic Web thematisiert, während es gerade in den Kultur- und Geisteswissenschaften vielfach noch Probleme beim richtigen Umgang mit dem Web 2.0 und größere Schwierigkeiten beim Zugang zur Anwendbarkeit des Web 3.0 gibt.
Quelle: http://kristinoswald.hypotheses.org/1102