Text und Data Mining – in Recht, Wissenschaft und Gesellschaft (Tagung in Trier)

Text und Data Mining (TDM) ist ein Sammelbegriff für automatische Analyseverfahren, mit deren Hilfe große Mengen von Informationen durchsucht, in Beziehung zueinander gesetzt und so Trends und neue Zusammenhänge aufgezeigt werden können.

Bei dem Einsatz der Analyseverfahren sind viele verschiedene Interessen von Verlagen, Datenbankinhabern, Journalisten, Wissenschaftlern auch in den Geistes- und Sozialwissenschaften, Unternehmern und der Allgemeinheit betroffen. Es ist Aufgabe von Recht, diese oft entgegengesetzten Interessen auszugleichen und durch klare Vorgaben Rechtssicherheit für alle Beteiligten zu schaffen.

Aus Anlass des neuen Urheberrechts-Wissensgesellschafts-Gesetzes (UrhWissG), das am 1. März 2018 in Kraft getreten ist, möchte die Tagung das Problemfeld Text und Data Mining in Recht, Wissenschaft und Gesellschaft aus vielfältiger, interdisziplinärer Perspektive beleuchten und einen Dialog entstehen lassen, in dem die Beteiligten ihre Anforderungen formulieren können, um so auf eine produktive weitere Ausgestaltung der rechtlichen Rahmenbedingungen des Text und Data Minings hinwirken zu können.

Keynote

Hannes Munzinger (Süddeutsche Zeitung, Redakteur Daten und digitale Investigation): „Panama und Paradise Papers – die Bedeutung von Text und Data Mining für den investigativen Journalismus“



[...]

Quelle: https://dhd-blog.org/?p=9821

Weiterlesen

Die Summe geisteswissenschaftlicher Methoden? Fachspezifisches Datenmanagement als Voraussetzung zukunftsorientierten Forschens (Bericht Panel AG Datenzentren, DHd 2018, Köln)

Autorin: Ulrike Wuttke für die DHd-AG Datenzentren

Am 1. März 2018 hielt die DHd-AG Datenzentren im Rahmen der DHd 2018 Köln (Kritik der digitalen Vernunft, 26.02.-02-03.2018, Universität zu Köln) ein Panel unter dem Titel “Die Summe geisteswissenschaftlicher Methoden? Fachspezifisches Datenmanagement als Voraussetzung zukunftsorientierten Forschens” ab (Start Download des Book of Abstracts, PDF). Organisiert wurde das Panel von Katrin Moeller, Historisches Datenzentrum Sachsen Anhalt (Hist-Data) und moderiert von Ulrike Wuttke (Stellvertretende Vorsitzende der AG Datenzentren des DHd, Fachhochschule Potsdam, Fachbereich Informationswissenschaften) und Jörg Wettlaufer (Göttingen Centre for Digital Humanities, Georg-August Universität Göttingen). Als PanelteilnehmerInnen nahmen neben Katrin Moeller teil: Marina Lemaire, Servicezentrum eSciences, Universität Trier, Matej Ďurčo, Austrian Center for Digital Humanities, Österreichische Akademie der Wissenschaften, und Patrick Sahle, Data Center for the Humanities (DCH), Universität zu Köln. Barbara Ebert, Leiterin der Göttinger Geschäftsstelle des Rats für Informationsinfrastrukturen (RfII), und Lukas Rosenthaler, Data and Service Center for the Humanities DaSCH, Universität Basel (DHLab) und Schweizerische Akademie der Geistes- und Sozialwissenschaften, die ebenfalls angekündigt waren, mussten sich leider entschuldigen.

[...]

Quelle: https://dhd-blog.org/?p=9740

Weiterlesen

Reproduzierbare Forschung und Erweitertes Publizieren mit Jupyter Notebooks

Digitale Methoden entwickeln sich zunehmend zur alltäglichen Praxis in den Geisteswissenschaften. Von der Erstellung einer Sammlung, über Bildanalysen, Text-Annotierung, bis hin zu Netzwerk-Analysen für die Ideengeschichte, keiner dieser Bereiche wird heutzutage noch ohne Computer angegangen.

Durch diese wachsende Bedeutung treten Themen, die ursprünglich in der Software-Entwicklung angesiedelt waren, in den Fokus der Geisteswissenschaften. So stellt sich zum Beispiel die Frage der Nachhaltigkeit einer Software-Entwicklung für ein geisteswissenschaftliches Forschungsvorhaben oder welchen Best-Practice-Maßstäbe dabei verfolgt werden sollten.

Notebook zu DARIAH-DE Topics

Eine relativ neue Entwicklung im Bereich der Software-Entwicklung ist das sogenannte „literate programming“, wobei ein Programm eher narrativ mit starkem Fokus auf die Lesbarkeit des Codes geschrieben wird. Dieses Paradigma ist besonders für wissenschaftliche Fragestellungen in der Lehre interessant.



[...]

Quelle: https://dhd-blog.org/?p=9709

Weiterlesen

Web – Programmierung, UX/UI – Design und Usability (Berlin, E 13 TV-L, 50%)

Die BBAW sucht für ihr Projekt „Kulturerbe als Linked Open Data – Pilotprojekt für den Census“ zum frühestmöglichen Zeitpunkt eine/einen Wissenschaftliche/n Mitarbeiter/in in Teilzeit (50 %) mit Erfahrungen mit Web-Programmierung, UX/UI-Design und Usability (befristet bis zum 31.12.2020).
Der Census of Antique Works of Art and Architecture Known in the Renaissance enthält ca. 250.000 Datensätze mit Abbildungen und Informationen zu antiken Monumenten, nachantiken Dokumenten, Orten und Personen. Im Rahmen des Projekts sollen ein geeignetes graphbasiertes Datenbanksystem gefunden und anhand eines Testdatensatzes einzelne prototypische, zeitgemäße, benutzungsfreundliche und nachhaltige Web-Module für die Visualisierung und Exploration von Forschungsdaten entwickelt werden.
Ihr Profil:

  • Einschlägiges abgeschlossenes Hochschulstudium
  • Erfahrung mit UX/UI-Design und Usability


  • [...]

Quelle: http://dhd-blog.org/?p=9700

Weiterlesen

Verlängerung: Stellenausschreibung Forschungsdatenmanager_in mit Programmierkenntnissen (100%, E 13)

Die Berlin-Brandenburgische Akademie der Wissenschaften sucht noch bis zum 3. April 2018 eine_n Forschungsdatenmanager_in mit Programmierkenntnissen zur Verstärung ihrer TELOTA-Initiative.

Die Aufgaben umfassen u.a.:

  • die Strategische und konzeptionelle Weiterentwicklung und Implementierung von Verfahren zum Forschungsdatenmanagement und der Langzeitarchivierung digitaler Projekte
  • die Entwicklung einer standardisierten Projektdokumentation
  • den Aufbau und Weiterentwicklung nachhaltiger Forschungsinfrastrukturen

Gesucht werden u.

[...]

Quelle: http://dhd-blog.org/?p=9630

Weiterlesen

RfII-Diskussionsimpuls 2018: Forschungsdaten(infrastrukturen) sind der Mittelpunkt von Forschung!

Am 15. Februar 2018 fand der erste von drei Workshops „Wissenschaftsgeleitete Forschungsinfrastrukturen für die Geisteswissenschaften“ statt, der einen Prozess der Konsortienbildung im Rahmen der Ausgestaltung Nationaler Forschungsdateninfrastrukturen in den Geisteswissenschaften bündeln und formieren möchte. Eingeladen waren zahlreiche, vornehmlich sprachwissenschaftlich orientierte, Verbände der Geisteswissenschaften und weiterer fachwissenschaftlicher Domänen. Sozusagen im Nachgang legte kurz darauf der Rat für Informationsinfrastrukturen (RfII) mit seiner Schrift „Zusammenarbeit als Chance“ einen neuen Diskussionsimpuls zur Ausgestaltung einer nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland vor. In meiner eigenen fachwissenschaftlichen Community wirkt diese Schrift daher fast wie eine Ergebniszusammenfassung des Workshops, auch wenn dies vielleicht Zufall ist. Den Aufruf zur Diskussion von Patrick Sahle (Beitrag „Auf dem Weg zu einem Netzwerk mit Kanten aber ohne Knoten?“) aufgreifend, möchte ich ebenfalls aus der Perspektive einer Wissenschaftlerin einige Eindrücke zusammenfassen.

Bedürfnisse des Forschungsdatenmanagements und der Digitalisierung in der Geisteswissenschaft  

Die Anforderungen der Fachcommunities an wissenschaftsgeleitete Forschungsinfrastrukturen für die Geisteswissenschaften sind weit, dies zeigte der Berliner Workshop.

[...]

Quelle: http://dhd-blog.org/?p=9556

Weiterlesen

RfII-Diskussionsimpuls 2018: Auf dem Weg zu einem Netzwerk mit Kanten aber ohne Knoten?

Im März 2018 hat der Rat für Informationsinfrastrukturen (RfII) den „zweiten Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland“ unter dem Titel „Zusammenarbeit als Chance“ veröffentlicht. Als in verschiedenen Kontexten Betroffener, der hier aber seine eigene und keine institutionelle Meinung vertritt, nehme ich diesen Impuls gerne auf und gehe im Folgenden auf nur vier Aspekte ein: einen beiläufigen, einen befriedigenden, einen für mich überraschenden und einen aus meiner Sicht problematischen.

1.      „Papiere von politikberatenden Gremien“ als literarisches Genre

Erklärungen, Stellungsnahmen, Positionspapiere, Impulstexte und was dergleichen Verlautbarungen noch für Namen haben dienen dazu, einen öffentlichen Diskurs herzustellen. Die politikberatenden Gremien im Wissenschaftsbetrieb versammeln besondere Kompetenzen zu einzelnen Themenfeldern oder bauen sie im Laufe ihrer Arbeit auf, um politische Entscheidungen auf eine gute sachliche und strategische Grundlage zu stellen. Sie verfolgen nominell keine eigene Agenda und treffen keine Entscheidungen. Ihr Wissen geben sie nicht nur an die Politik weiter, sondern stellen es auch in der wissenschaftlichen Gemeinschaft zur Verfügung und zu Diskussion. Soweit die Theorie. In der Wirklichkeit sind alle Akteure in Gremien oder auf Geschäftsstellen der Wissenschaftsorganisation zugleich Angehörige von Fachdisziplinen, von Verbänden, von Forschungseinrichtungen, von anderen Institutionen und Netzwerken.

[...]

Quelle: http://dhd-blog.org/?p=9547

Weiterlesen

Digitale Briefverzeichnisse einfacher erstellen

Die überwiegende Menge der Briefeditionen liegt auch im digitalen Zeitalter noch ausschließlich gedruckt vor. Um die edierten Briefe und die darin enthaltenen Informationen auch digital verfügbar zu machen, können Briefmetadaten im Correspondence Metadata Interchange Format (CMIF) bereitgestellt und mit dem Webservice correspSearch durchsucht werden. Waren bisher für die Erstellung von Briefverzeichnissen in CMIF XML-Kenntnisse notwendig, erleichtert nun der online verfügbare “CMIF Creator” die Erfassung erheblich.

Der CMIF Creator wird im Rahmen des DFG-geförderten Projekts „correspSearch – Briefeditionen vernetzen“ entwickelt und steht jetzt in einer ersten Beta-Version unter http://correspSearch.net/cmif-creator bereit. Mit seiner Hilfe können Bearbeiter*innen von gedruckten Briefeditionen die Metadaten zu edierten oder auch erschlossenen Briefen gemäß dem CMIF über ein Formular bequem erfassen. Die Arbeit kann zu jedem Zeitpunkt unterbrochen und die CMIF-Datei lokal auf dem eigenen Computer gespeichert werden. Möchte man die Arbeit fortsetzen, kann man die bisherige CMIF-Datei einfach wieder in den CMIF Creator laden.

[...]

Quelle: http://dhd-blog.org/?p=9303

Weiterlesen

Veröffentlichung des Grundsatzpapiers der DHd AG Datenzentren zur Sicherung der langfristigen Verfügbarkeit von Forschungsdaten

Der 2013 gegründete Verband DHd („Digital Humanities im deutschsprachigen Raum“) versteht sich als Forum und formelle Interessenvertretung für alle, die sich im deutschsprachigen Raum in Forschung und Lehre sowie in Dienstleistungen im Bereich digitale Geisteswissenschaften („Digital Humanities“) engagieren.

In der DHd-Arbeitsgruppe Datenzentren sind Einrichtungen und Infrastrukturen im deutschsprachigen Raum vertreten, die – teils schon jetzt, teils perspektivisch – konkrete Dienstleistungen zum nachhaltigen Umgang mit Forschungsdaten anbieten.

Im jetzt vorliegenden Grundsatzpapier “Geisteswissenschaftliche Datenzentren im deutschsprachigen Raum. Grundsatzpapier zur Sicherung der langfristigen Verfügbarkeit von Forschungsdaten” werden Potenziale und Perspektiven der beteiligten Datenzentren sowie der AG Datenzentren beleuchtet und mit einigen Narrativen ergänzt, die einen Einblick in den Themenkomplex geben.

Das Grundsatzpapier steht unter http://doi.org/10.5281/zenodo.

[...]

Quelle: http://dhd-blog.org/?p=9317

Weiterlesen