TextGrid 2.0 veröffentlicht

Pünktlich zum zweiten TextGrid Summit, der dieses Mal in Darmstadt stattfindet, ist die virtuelle Forschungsumgebung TextGrid in der Version 2.0 herausgekommen, die im Vergleich zur Version 1.0 um etliche Module und Funktionen reicher ist.

Außerdem wurde ein Film ”Virtuelle Forschungswelten: Neue Technologien in den Geisteswissenschaften” im Auftrag der D-Grid GmbH in Kooperation mit TextGrid produziert.

Quelle: http://dhd-blog.org/?p=533

Weiterlesen

Visualisierung von Ergebnissen

Anlässlich mehrerer Tagungen, auf denen wir Tesla präsentieren dürfen, haben wir ein wenig an der Visualisierung von Experiment-Ergebnissen gearbeitet, v.a hat Stephan die neueste Version seines WordCloud-Erzeugers Cloudio in den Client von Tesla integriert. Damit können jetzt Wortwolken, wie die oben im Titelbild meines Blogs, innerhalb von Tesla erzeugt werden.

Ich möchte die Gelegenheit nutzen, die bisher implementierten Tesla-Visualisierer hier im Blog vorzustellen, bevor wir heute das nachmittag ab 15:15 Uhr live im TextGrid-Café tun. Visualisierung wird vor allem da benötigt, wo die automatische Evaluation von Ergebnissen zu kurz greift und die Forscherin/der Forscher, der experimentell arbeitet, ihre/seine Ergebnisse mittels ihres/seines Intellektes überprüfen will. Wie es das Thema verlangt, werden hier mehr Screenshots denn Texte im Vordergrund stehen.

Alle folgenden Visualisierungen basieren auf den Ergebnissen eines einzigen Experiments, [das irgendwann im Laufe der Woche von Alena bei der Plattform MyExperiment geshart wird, ich binde den Link dann ein]. Dabei geht es eigentlich nur um eine Studie zu einer Methode, temporale Ausdrücke aus Texten zu extrahieren. Der zugehörige Workflow sieht im Editor wie folgt aus:

Oben im Workflow finden sich Wikipedia-Texte, deren temporale Ausdrücke vorausgezeichnet wurden. Auf der linken Seite befindet sich die Komponenten, deren Zusammenspiel diese temporalen Ausdrücke (ohne die Kenntnis der Vorauszeichnungen) ermitteln soll. Auf der rechten Seite steht, relativ allein, die Evaluationskomponente, welche die Menge der vorausgezeichneten Ausdrücke mit der Menge der experimentell ermittelten vergleicht.

Nach der Ausführung des Experiments steht zunächst eine Ergebnis-Übersicht zur Verfügung, in der Informationen zu den einzelnen Komponenten abrufbar sind, hier schreibt z.B. die Evaluationskomponente ihre ermittelten Werte zur Precision, Recall und F1-Wert hinein:


Möglicherweise ist am aber nicht nur an den Evaluationsmaßen interessiert, sondern auch daran, welche der vorausgezeichneten Ausdrücke denn nun gefunden wurden und welche nicht. Dabei möchte man vielleicht auch direkt den Kontext sehen, in dem sich die (nicht) gefundenen Ausdrücke befinden. Hierfür bietet sich z.B. ein farblich unterlegter Text an:

In dieser Visualisierung sind die vorausgezeichneten (rot) und die ermittelten (gelb) temporalen Ausdrücke markiert. Überlappen sich beide, so werden sie mit der Mischfarbe (orange) markiert. Hier sieht man, dass der Versuchsaufbau für Datums-Angaben verschiedenen Formats recht gut funktioniert und noch Verbesserungen hinsichtlich von zeitbezogenen Wörtern eingebracht werden könnten (etwa durch Erweiterung der Gazetteer-Listen).

Vielleicht möchte man aber auch eine Aufstellung allerermittelten temporalen Ausdrücke haben. Dafür hat Tesla eine Tabellen-Visualisierung (Tabellen können auch direkt in ein csv-Format exporiert werden, um sie woanders weiter zu verarbeiten):

Außerdem verfügt Tesla noch über eine Visualisierung in Klammerstruktur (um etwa Dominanzbeziehungen zwischen Elementen im Text auszudrücken, den Sceenshot spare ich mir ausnahmsweise mal) und eben über die WordCloud, die zumindest visuell momentan der Höhepunkt jeder Tesla-Präsentation ist, auch wenn es nicht für jedes Datum Sinn macht, es in einer Cloud darzustellen. In der folgenden Abbildung sind etwa alle temporalen Ausdrücke nach ihrer Häufigkeit aufgetragen. Kann man nicht unbedingt für Interpretationszwecke nutzen, schön aussehen tut es dennoch:

Soweit meine kurzen Ausführungen zu den bereits in Tesla integrierten Visualisieren. Wir wissen selbst, dass es noch eine Menge von Möglichkeiten gibt, die zu integrieren sich wirklich lohnen würde, etwa einen Datenplotter und Darstellungsmöglichkeiten für statistische Auswertungen. Auch die allen Visualisierungen zugrundeliegende Datenstruktur ist historisch gewachsen und inzwischen überarbeitungsbedüftig. Ist auf der Liste der nice-to-haves. Ob wir wirklich noch mehr realisieren können hängt aber vor allem von potentiellen Geldgebern ab (sonst haben wir soviel anderes zu tun). Wir hoffen mal das Beste.

 

 

Quelle: http://texperimentales.hypotheses.org/229

Weiterlesen

Orientierung in Amman

Die Fotografin Regina Mamou hat sich mit der Navigation in der jordanischen Hauptstadt Amman beschäftigt, bei der nicht immer Hausnummern angegeben werden; Atlantic Cities berichtet darüber.

Fotos von Hausnummern in Amman gab's ja bereits im Adresscomptoir:
http://adresscomptoir.twoday.net/stories/6342205/
http://adresscomptoir.twoday.net/stories/6322852/
http://adresscomptoir.twoday.net/stories/6331958/

Quelle: http://adresscomptoir.twoday.net/stories/97021195/

Weiterlesen

WissensNetz – Digitale Infrastrukturen in den historischen Kulturwissenschaften

Mitgeteilt von Georg Schelbert.

Am 1. Juni 2012 findet am Institut für Kunst- und Bildgeschichte unter dem Namen „WissensNetz“ ein Workshop zum Thema der digitalen Infrastrukturen in den historischen Kulturwissenschaften statt.
Die Veranstaltung versteht sich als Gesprächsrunde, die Gelegeneit geben soll, sich in einem überschaubaren Kreis und mit durchaus grundsätzlichem Ansatz einerseits über den Stand an Konzepten und Ideen zum digitalen Wissensmanagement in den historischen, mit Artefakten und Bildern arbeitenden Kulturwissenschaften auszutauschen, andererseits den Bedarf an einschlägigen Infrastrukturentwicklungen, in erster Linie Datenbanksystemen, Kommunikationsplattformen etc., insbesondere für die akademische Forschung, zu ermitteln und gegebenenfalls eine einschlägige Arbeitsgruppe zu bilden.
Am Vormittag werden von eingeladenen Teilnehmern einige kunst- und kulturhistorische Dokumentationsprojekte und -konzepte vorgestellt. Am Nachmittag ist eine Gesprächsrunde zur Entwicklung von Zukunftsperspektiven auf dem Gebiet der digitalen Infrastrukturen in den historischen Kulturwissenschaften angesetzt.

Ich würde mich darüber freuen, wenn Sie an diesen beiden Programmteilen teilnehmen wollten. Angesichts des der limitierten Größe des vorgesehenen Tagungsraumes bitte ich um kurze Anmeldung, damit wir bei größerem Interesse ggf. noch umdisponieren können.

Mehr Information

Quelle: http://dhd-blog.org/?p=529

Weiterlesen

Call for papers für das Heft der Zeitschrift Behemoth – „Kriminelle Organisationen zwischen illegalen Märkten und politischer Gewalt”

Von Axel T. Paul Die Zeitschrift Behemoth (www.behemoth-journal.de; peer-reviewed) widmet sich Fragen, Problemen und Aspekten dysfunktionaler Staatlichkeit, ohne daß diese selbst ausdrücklich Thema sein müßte. Dysfunktionale Staatlichkeit beinhaltet vielmehr auch all jene vorder-gründig nicht-politischen Phänomene, welche Verstaatlichung be- oder verhindern bzw. Staatlichkeit als Verfassung oder Zustand bedrohen, bestreiten und auflösen. Thema des geplanten Heftes sind kriminelle Organisationen. Die Leitidee lautet, daß diese empirisch wie konzeptionell sinnvoll zwischen illegalen Märkten und politischer Gewalt verortet werden können. Mit illegalen Märkten sind kriminelle Organisationen insofern verbunden, als [...]

Quelle: http://soziologieblog.hypotheses.org/2205

Weiterlesen