Visualisierung von Ergebnissen

Anlässlich mehrerer Tagungen, auf denen wir Tesla präsentieren dürfen, haben wir ein wenig an der Visualisierung von Experiment-Ergebnissen gearbeitet, v.a hat Stephan die neueste Version seines WordCloud-Erzeugers Cloudio in den Client von Tesla integriert. Damit können jetzt Wortwolken, wie die oben im Titelbild meines Blogs, innerhalb von Tesla erzeugt werden.

Ich möchte die Gelegenheit nutzen, die bisher implementierten Tesla-Visualisierer hier im Blog vorzustellen, bevor wir heute das nachmittag ab 15:15 Uhr live im TextGrid-Café tun. Visualisierung wird vor allem da benötigt, wo die automatische Evaluation von Ergebnissen zu kurz greift und die Forscherin/der Forscher, der experimentell arbeitet, ihre/seine Ergebnisse mittels ihres/seines Intellektes überprüfen will. Wie es das Thema verlangt, werden hier mehr Screenshots denn Texte im Vordergrund stehen.

Alle folgenden Visualisierungen basieren auf den Ergebnissen eines einzigen Experiments, [das irgendwann im Laufe der Woche von Alena bei der Plattform MyExperiment geshart wird, ich binde den Link dann ein]. Dabei geht es eigentlich nur um eine Studie zu einer Methode, temporale Ausdrücke aus Texten zu extrahieren. Der zugehörige Workflow sieht im Editor wie folgt aus:

Oben im Workflow finden sich Wikipedia-Texte, deren temporale Ausdrücke vorausgezeichnet wurden. Auf der linken Seite befindet sich die Komponenten, deren Zusammenspiel diese temporalen Ausdrücke (ohne die Kenntnis der Vorauszeichnungen) ermitteln soll. Auf der rechten Seite steht, relativ allein, die Evaluationskomponente, welche die Menge der vorausgezeichneten Ausdrücke mit der Menge der experimentell ermittelten vergleicht.

Nach der Ausführung des Experiments steht zunächst eine Ergebnis-Übersicht zur Verfügung, in der Informationen zu den einzelnen Komponenten abrufbar sind, hier schreibt z.B. die Evaluationskomponente ihre ermittelten Werte zur Precision, Recall und F1-Wert hinein:


Möglicherweise ist am aber nicht nur an den Evaluationsmaßen interessiert, sondern auch daran, welche der vorausgezeichneten Ausdrücke denn nun gefunden wurden und welche nicht. Dabei möchte man vielleicht auch direkt den Kontext sehen, in dem sich die (nicht) gefundenen Ausdrücke befinden. Hierfür bietet sich z.B. ein farblich unterlegter Text an:

In dieser Visualisierung sind die vorausgezeichneten (rot) und die ermittelten (gelb) temporalen Ausdrücke markiert. Überlappen sich beide, so werden sie mit der Mischfarbe (orange) markiert. Hier sieht man, dass der Versuchsaufbau für Datums-Angaben verschiedenen Formats recht gut funktioniert und noch Verbesserungen hinsichtlich von zeitbezogenen Wörtern eingebracht werden könnten (etwa durch Erweiterung der Gazetteer-Listen).

Vielleicht möchte man aber auch eine Aufstellung allerermittelten temporalen Ausdrücke haben. Dafür hat Tesla eine Tabellen-Visualisierung (Tabellen können auch direkt in ein csv-Format exporiert werden, um sie woanders weiter zu verarbeiten):

Außerdem verfügt Tesla noch über eine Visualisierung in Klammerstruktur (um etwa Dominanzbeziehungen zwischen Elementen im Text auszudrücken, den Sceenshot spare ich mir ausnahmsweise mal) und eben über die WordCloud, die zumindest visuell momentan der Höhepunkt jeder Tesla-Präsentation ist, auch wenn es nicht für jedes Datum Sinn macht, es in einer Cloud darzustellen. In der folgenden Abbildung sind etwa alle temporalen Ausdrücke nach ihrer Häufigkeit aufgetragen. Kann man nicht unbedingt für Interpretationszwecke nutzen, schön aussehen tut es dennoch:

Soweit meine kurzen Ausführungen zu den bereits in Tesla integrierten Visualisieren. Wir wissen selbst, dass es noch eine Menge von Möglichkeiten gibt, die zu integrieren sich wirklich lohnen würde, etwa einen Datenplotter und Darstellungsmöglichkeiten für statistische Auswertungen. Auch die allen Visualisierungen zugrundeliegende Datenstruktur ist historisch gewachsen und inzwischen überarbeitungsbedüftig. Ist auf der Liste der nice-to-haves. Ob wir wirklich noch mehr realisieren können hängt aber vor allem von potentiellen Geldgebern ab (sonst haben wir soviel anderes zu tun). Wir hoffen mal das Beste.

 

 

Quelle: http://texperimentales.hypotheses.org/229

Weiterlesen

Call for papers für das Heft der Zeitschrift Behemoth – „Kriminelle Organisationen zwischen illegalen Märkten und politischer Gewalt”

Von Axel T. Paul Die Zeitschrift Behemoth (www.behemoth-journal.de; peer-reviewed) widmet sich Fragen, Problemen und Aspekten dysfunktionaler Staatlichkeit, ohne daß diese selbst ausdrücklich Thema sein müßte. Dysfunktionale Staatlichkeit beinhaltet vielmehr auch all jene vorder-gründig nicht-politischen Phänomene, welche Verstaatlichung be- oder verhindern bzw. Staatlichkeit als Verfassung oder Zustand bedrohen, bestreiten und auflösen. Thema des geplanten Heftes sind kriminelle Organisationen. Die Leitidee lautet, daß diese empirisch wie konzeptionell sinnvoll zwischen illegalen Märkten und politischer Gewalt verortet werden können. Mit illegalen Märkten sind kriminelle Organisationen insofern verbunden, als [...]

Quelle: http://soziologieblog.hypotheses.org/2205

Weiterlesen

Schweigens Bruder

  Gastbeitrag von Simona Hurst. Die Darstellung von Schlafenden ist ein wiederkehrendes Motiv in der Kunst: Die schlafende Venus, schlummernde Musen, der Schlaf des Endymion, die Jünger Jesu am Fuße des Ölbergs oder auch der hundertjährige Schlaf Dornröschens. Im Bild des Schlafs drückt sich notwendig auch das Bild des Schweigens aus. Abgesehen von unwillkürlichen Äußerungen, die der Mensch beim Träumen von sich gibt, ist der Schlaf ein Zustand der Stille. Intensiver begegnen uns Stille und Schweigsamkeit besonders dort, wo wir sie nicht erwarten. Ein Gemälde, [...]    

Quelle: http://dtforum.hypotheses.org/616

Weiterlesen

Fotografieren im Archiv – Teil 1

  Ich bin vor wenigen Tagen von einer Archivreise aus Oslo zurückgekehrt. Während meiner Recherche am Riksarkivet und dem Archiv des Norges Hjemmefrontmuseum (NHM) wurde mir wieder vor Augen geführt, wie viele Arbeitsschritte es gibt, über die ich mir im Vorfeld der Archivarbeit nicht oder nur unzureichend Gedanken gemacht habe. Ein solches Beispiel ist das Abfotografieren von Archivalien (vorausgesetzt, dies wird von Seiten des Archives erlaubt). Besonders als Doktorand mit geringem Reise- und Kopiebudget ist dies ein wichtiges Thema. Jedoch ist mir bis heute kein [...]    

Quelle: http://umstrittenesgedaechtnis.hypotheses.org/77

Weiterlesen

Heute schon online gespielt?

  Ich habe mir einige Online-Spiele, die auf Facebook angeboten werden, angesehen und ausprobiert. Interessant ist die Vermittlung der Spielregeln sowie die Spielführung. Bei analogen Spielen muss man zuerst die Anleitung, die meist in Papierform beigelegt ist, lesen und verstehen. Bei Computerspielen gibt es hierfür neue Möglichkeiten. Die Regeln der in Klammern genannten Spiele werden wie folgt vermittelt:
  • In der ersten Runde wird der Spieler mittels eines Pfeils, der auf dem Monitor erscheint, auf die Stelle hingewiesen, auf die er klicken soll (GnomeTown, Dorfleben).
  • Kleine, nicht animierte Illustrationen visualisieren die Aktivität, die mit der Maus ausgelöst werden soll (Angry Birds).
  • Ein Avatar führt durch das Spiel. Seinen Anleitungen und Hinweisen, die in Sprechblasen stehen, folgt der Spieler (Castle Ville, Candy Crush Saga).
Auf diese Weise muss man sich nicht viel merken, denn das, was man für die nächste Aktivität wissen muss, bekommt man in kleinen Häppchen serviert. Großartige Gedächtnisleistungen sind also nicht von Nöten. Daran ist zunächst mal nichts Schlechtes. Erklärung und Bedienung sind ineinander verflochten, was ich mir für manche Online-Hilfe von Anwender-Software gut vorstellen könnte. Die genannten Spiele sind einfach gestrickt. Die Art der Erleichterung der Bedienung nimmt dem Spieler fast das Spielen ab. Gerät der Spielfluss z.B. bei dem Spiel Candy Crush Saga ins Stocken, blinken die zu bewegenden Elemente auf. Der Spieler braucht also nur wenig Mühe zu investieren; alles wird so leicht wie möglich gemacht, weil das Spiel zur richtigen Zeit zur adäquaten Aktivität am richtigen Ort auffordert. Das heißt auch, dass der Spieler im Wesentlichen auf die Aufforderungen reagiert, weniger selbstständig agiert, dafür aber mit überschwänglichem Lob, Tausenden von Punkten und dem Erreichen des nächsten Levels belohnt wird. Die Frage ist, wie schnell solche Spiele an Reiz verlieren, wenn alles so leicht geht, es kaum Mühe kostet, einen Spielerfolg zu erzielen. Bei Caillois (Die Spiele und die Menschen) lesen wir, dass „Spiele weitgehend von den Kulturen, in denen sie betrieben werden, abhängig sind“. Wenn das so ist, könnte es einen Zusammenhang zwischen den leicht zu erreichenden Spielerfolgen der virtuellen Welt und den zum Teil sehr schwierigen Bedingungen der realen Arbeitswelt geben. Darüber kann man mal nachdenken.    

Quelle: http://games.hypotheses.org/177

Weiterlesen

Das Leben der Alten – vom Mehrwert der Erforschung des Lebens der Rentner in der DDR

  Steffen Otte Der Erforschung von Struktur, Entwicklung und Funktionsweise der DDR ist in den letzten 20 Jahren durch die Wissenschaft große Aufmerksamkeit gewidmet worden. Neben der Untersuchung des politischen Systems der DDR hat auch die Analyse der sozialen Verhältnisse der … Weiterlesen    

Quelle: http://netzwerk.hypotheses.org/1372

Weiterlesen

Neuigkeiten 1204

Nach einem abermaligen kurzen Ausflug in die historische Kryptographie komme ich nun wieder zum Kerngeschäft dieses Blogs zurück und berichte über die aktuellen Entwicklungen rund um Tesla, unserem Labor für Textwissenschaftler.

Momentan wird ein Großteil unserer Zeit davon beansprucht, abzuwägen, welche Weiterentwicklungen von Tesla wünschenswert und gleichzeitig förderungswürdig sind. Relativ sicher sind wir uns da hinsichtlich der Integration von Tesla in die Software, die innerhalb des Projekts TextGrid entstanden ist. Die ersten Gespräche haben dazu schon (mit sehr netten Leuten übrigens) stattgefunden, und wie es aussieht, sind beide Seiten der Meinung, dass die Systeme bisher relativ komplementäre Funktionalität bieten und dass eine Integration der beiden großen Gewinn für die geisteswissenschaftliche Community böte, auf die sowohl TextGrid wie auch Tesla ausgerichtet sind. Ich bin sehr gespannt, wie die weiteren Schritte diesbezüglich ausfallen, wenn wir uns im Rahmen des TextGrid Summit 2012 nochmal zusammensetzen.

Jenseits der TextGrid-Tesla-Integration gibt es aber auch noch eine Reihe weiterer Verbesserungen unseres Systems, die wir gerne in Angriff nehmen würden. Ich hatte ja bereits über die Möglichkeit gebloggt, Tesla-Experimente über das wissenschaftliche Social Network MyExperiment auszutauschen. Mit ein wenig Zeit könnte man die entsprechende Schnittstelle in einer Art ausbauen, dass der Upload aller relevanten Daten (Komponenten, Texte, Screenshot etc.) mit einem einzelnen Mausklick erfolgt. Weiterhin könnte beispielsweise die Unterstützung von Werkzeug-Entwicklern etwas komfortabler gestaltet werden, zur Zeit muss man noch viel zu Fuß erledigen, was eigentlich automatisierbar wäre. Unsere Überlegungen gehen auch dahin, Tesla Cloud-Computing-fähig zu machen, so dass wirklich komplexe Berechnungen auf wirklich großen Datenmengen in akzeptabler Zeit ermöglich werden. Stephan testet zur Zeit das Clustering von Vektoren auf Grafikkarten und erreicht damit eine schon jetzt beeindruckende Performance-Gewinne. Wenn man sich jetzt vorstellt, dass man nicht nur eine, sondern eine ganze Reihe von Grafikkarten nutzt (z.B. die unserer Computerpools zu Zeiten, in denen diese nicht öffentlich genutzt werden), so könnte man in ganz neue Sphären von Experiment-Setups in der Textprozessierung vorstoßen.

Abgesehen von dieser Zukunftsmusik (die wahrscheinlich auch nur gespielt wird, wenn wir Gutachter davon überzeugen können, dass es sich um wirklich förderungswürdige Vorhaben handelt) entwickeln wir Tesla gegenwärtig natürlich auch schon weiter. Zentral ist dabei momentan die vollständige Umstellung des Build-Prozesses auf Maven sowie der Umzug des Source-Codes auf GitHub. Im Rahmen einer Bachelorarbeit bei uns am Institut entstand vor kurzem auch ein Reader für TEI-codierte Dramen. Außerdem sind in letzter Zeit eine Reihe von Leuten auf uns zugekommen, die ihre Projekte mit Tesla bearbeiten wollen und die wir dabei gerne unterstützen. Daran, dass diese Anfragen aus sehr unterschiedlichen Fachbereichen kommen – Linguisten aus verschiedenen Philologien (Anglisten, Romanisten und Skandinavisten), Sprachtechnologen und sogar Geographen – kann man auch ersehen, dass Tesla keinesfalls nur auf Computerlinguisten ausgerichtet ist.

Wir stellen Tesla übrigens im nächsten Monat gleich zweimal vor, zuerst auf dem schon oben erwähnten TextGrid-Summit (Systemdemo/Postersession 15.5. an der TU Darmstadt), danach auf der TaCoS (Vortag 1.6. an der Uni Trier). Auf diesem Weg noch einmal herzlichen Dank für die beiden sehr netten Einladungen! Vielleicht sieht man sich ja.

 

 

Quelle: http://texperimentales.hypotheses.org/205

Weiterlesen

Lieber ARTigo spielen als ins Museum gehen?

Bei einem Museumsbesuch verbringt der Betrachter vor einem Kunstwerk durchschnittlich elf Sekunden, ermittelte Martin Tröndle. Einen ausführlichen Bericht der Untersuchungen Tröndles kann man auf ZEIT ONLINE in dem Artikel Und die Herzen schlagen höher lesen.

Beim Spielen von ARTigo betrachtet der Spieler eine Minute lang intensiv ein Bild, das er beschreiben soll. Er verbringt also fast 6x so viel Zeit damit wie im Museum. Die Vermutung liegt deshalb nahe, dass er davon auch mehr hat, als von einem Museumsbesuch.

„Was sehen die Besucher, wenn sie Kunst sehen? Was empfinden sie? Was nehmen sie mit? Wenn man Tröndles Studie richtig versteht, dann gehört die Zukunft des Museums diesen Fragen“(Zitat aus dem o.g. Artikel).

Zur Beantwortung dieser Fragen könnte vielleicht die ARTigo-Forschung einen Beitrag leisten.

Quelle: http://games.hypotheses.org/137

Weiterlesen

Visuelle Ästhetik in der Mensch-Computer-Interaktion und im Interaktionsdesign

Kürzlich ist der Artikel „Visual Aesthetics in human-computer interaction and interaction design“ von Noam Tractinsky auf www.interaction-design.org erschienen.

Tractinsky trägt in seinem Artikel zahlreiche Forschungsergebnisse in Bezug auf visuelle Ästhetik über die Schnittstelle zwischen Mensch und Computer zusammen. Die folgenden Punkte sind mir besonders aufgefallen:

  • Ästhetische Eindrücke werden sehr schnell gebildet. Wir brauchen gerade eine halbe Sekunde dafür, uns ein Urteil zu bilden, ob wir eine Webpage schön oder nicht schön finden.
  • Das ästhetische Urteil bezieht sich dabei nicht nur auf die visuelle Schönheit einer Webpage oder Software, sondern auch auf Systemattribute, die Benutzerfreundlichkeit und eine allgemeine Zufriedenheit vermitteln, sowie die Leistung bzw. Funktionalität der Anwendung.
  • Wenn man der These von Donald Norman: “Attractive things work better” folgt, ergibt sich daraus die Frage, inwieweit visuelle Ästhetik nicht nur die Wahrnehmung des Anwenders beeinflusst, sondern auch dessen Leistung.

Ich beziehe nun die vorangegangenen Ergebnisse auf Computerspiele und formuliere Fragen, die sich in Bezug auf Computerspiele daraus ergeben:

Wie bereits oben erwähnt, bildet sich der Spieler sehr schnell ein Urteil über die visuelle Ästhetik eines Spiels. Dass es gender-spezifische Spielvorlieben bezüglich der Spielidee gibt, wird in der Literatur beschrieben (männliche Jugendliche spielen gerne Shooter-Spiele, Mädchen bevorzugen Casual Games, das sind Spiele, für die keine besonderen Vorkenntnisse oder ein hoher Zeitaufwand nötig ist und die schnell zu einem Spielerfolg führen.):

  • Gibt es neben dem gender-spezifischen Einfluss auf die Auswahl des Spielgenres auch einen ästhetischen Einfluss?
  • Welchen Einfluss hat der visuelle Eindruck innerhalb eines bevorzugten Spielgenres auf die Auswahl eines Spiels?
  • Inwieweit hängt die Attraktivität eines Spiels, d.h. wie häufig es gespielt wird, vom ästhetischen Eindruck ab. Ab wann nutzt sich ein Spiel ab, wird also seltener oder gar nicht mehr gespielt? Ist hier allein die Spielidee ausschlaggebend? Inwieweit könnten visuell-ästhetische Prozesse hieran beteiligt sein?
  • Welchen Einfluss auf die Wahl eines Spiels hat der Gamesound? Gibt es einen Zusammenhang zwischen visueller und auditiver Ästhetik auf die Auswahl von Spielen?

Ästhetik als Tüpfelchen auf dem i zu verstehen würde heißen, ihre Bedeutung auf unser Leben, Denken und Tun klar zu unterschätzen. Von der Wirkung ästhetischer Wahrnehmungsprozesse, die uns meistens nicht bewusst sind, nehmen wir, bildlich gesprochen, nur die Spitze des Eisbergs wahr – dies auch im Hinblick auf Computerspiele.

Quelle: http://games.hypotheses.org/126

Weiterlesen

(Blog-)Inhalte und Urheberrechte

Im Umgang mit Urheberrechten in Bezug auf (Blog-)Inhalte gibt es verschiedene Möglichkeiten.  Wir empfehlen Ihnen die Verwendung einer Creative-Commons-Lizenz.

Creative Commons (CC) ist eine Non-Profit-Organisation, die in Form vorgefertigter Lizenzverträge eine Hilfestellung für die Veröffentlichung und Verbreitung digitaler Medieninhalte anbietet.

Konkret bietet CC sechs verschiedene Standard-Lizenzverträge an, die bei der Verbreitung kreativer Inhalte genutzt werden können, um die rechtlichen Bedingungen festzulegen. Eine CC-Lizenzierung bietet über das Urheberrecht hinausgehende Freiheiten bei der Nutzung digitaler Medieninhalte. Welche Freiheiten zusätzlich geboten werden, hängt vom gewählten CC-Lizenzvertrag ab.

Man erkennt schon am Namen des jeweiligen CC-Lizenztyps, welche die wichtigsten Bedingungen bei der Nutzung des Inhalts sind. Der einfachste CC-Lizenzvertrag verlangt vom Nutzer (Lizenznehmer) lediglich die Namensnennung des Urhebers/Rechteinhabers (Lizenzgeber). Darüber hinaus können aber weitere Einschränkungen gemacht werden, die eine kommerzielle Nutzung, nachträgliche Bearbeitung und anschließende Weitergabe regeln. Durch die Kombination dieser Bedingungen ergibt sich die schon genannte Auswahl von insgesamt sechs verschiedenen CC-Lizenzen, die dem Rechteinhaber für den deutschen Rechtsraum derzeit in der Version 3.0 zur Verfügung stehen.

Ein wichtiger Vorteil der CC-Lizenzen ist die Reduktion der Kosten, insbesondere im Hinblick auf Vertrieb, (Vorab-)Information möglicher Lizenznehmer und im Falle von (Nach-)Verhandlungen bei unsachgemäßer Nutzung.

Die Internetseite http://de.creativecommons.org/was-ist-cc/ bietet weitere Informationen zu CC-Lizenzen.

Auf der Seite http://creativecommons.org/choose/?lang=de  können Sie über einen Fragebogen den passenden Lizenzvetrag auswählen und schließlich eines der folgenden Elemente in eine Seitenspalte oder Ihr Impressum einfügen:

1. Namensnennung (Kurzform: BY)

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung 3.0 Deutschland Lizenz.

2. Namensnennung, Weitergabe unter gleichen Bedingungen (Kurzform: BY-SA)

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung-Weitergabe unter gleichen Bedingungen 3.0 Deutschland Lizenz.

3. Namensnennung, keine Bearbeitung (Kurzform: BY-ND)

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung-Keine Bearbeitung 3.0 Deutschland Lizenz.

4. Namensnennung, nicht kommerziell (Kurzform: BY-NC)

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung-Nicht-kommerziell 3.0 Deutschland Lizenz.

5. Namensnennung, nicht kommerziell, Weitergabe unter gleichen Bedingungen (Kurzform: BY-NC-SA)

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung-Nicht-kommerziell-Weitergabe unter gleichen Bedingungen 3.0 Deutschland Lizenz.

6. Namensnennung, nicht kommerziell, keine Bearbeitung (Kurzform: BY-NC-ND)

Dieses Werk bzw. Inhalt steht unter einer Creative Commons Namensnennung-NichtKommerziell-KeineBearbeitung 3.0 Deutschland Lizenz.

 Namensnennung — Sie müssen den Namen des Autors/Rechteinhabers in der von ihm festgelegten Weise nennen.
Keine kommerzielle Nutzung — Dieses Werk bzw. dieser Inhalt darf nicht für kommerzielle Zwecke verwendet werden.
Keine Bearbeitung — Dieses Werk bzw. dieser Inhalt darf nicht bearbeitet, abgewandelt oder in anderer Weise verändert werden; Sampling wird zum Beispiel nicht ermöglicht.
Weitergabe unter gleichen Bedingungen — Wenn Sie das lizenzierte Werk bzw. den lizenzierten Inhalt bearbeiten oder in anderer Weise erkennbar als Grundlage für eigenes Schaffen verwenden, dürfen Sie die daraufhin neu entstandenen Werke bzw. Inhalte nur unter Verwendung von Lizenzbedingungen weitergeben, die mit denen dieses Lizenzvertrages identisch oder vergleichbar sind.

Kombinationsbeispiel: Creative Commons BY-NC-SA

Weitere Literatur

Nutzungsbroschüre “The Power of Open” von CC auf deutsch (pdf)

 

Originalbeitrag auf französisch: http://maisondescarnets.hypotheses.org/21
Übersetzung ins Deutsche: Inger Brandt, DHI Paris

Quelle: http://bloghaus.hypotheses.org/258

Weiterlesen