Algorithmen für Ängstliche

In jüngerer Zeit kam die Berichterstattung über Algorithmen wieder auf die Tagesordnung und man ist fast versucht, als Tenor “Lasst, die ihr eintretet, alle Hoffnung fahren!” zu vernehmen: Die Welt ist beherrscht von einer weithin unbekannten Supermacht, die das Dasein jedes Einzelnen und das Zusammenleben aller durch unsichtbare Fäden aus dem Hintergrund lenkt. Da werden Frauen über ihr Konsumverhalten als schwanger kategorisiert, ehe sie sich dessen selbst bewusst werden. Da bekommen Lebensgemeinschaften keinen Kredit, weil sie am falschen Ende der Straße wohnen. Da plant ein Online-Versand, Kunden die gewünschten Waren zuzusenden, bevor sie überhaupt daran dachten, diese zu bestellen. Und das alles nur, weil da jemand die “richtige mathematische Formel” gefunden hat und in der Lage war, diese “auf einem Computer zu programmieren”. Und jetzt sind die so geschaffenen Algorithmen dabei, sich von ihren Schöpfern loszusagen und die gesamte Menschheit bis zum Sankt Nimmerleinstag zu knechten.

angst

Der Zaubertrank: Deep Learning

Ich habe zunächst versucht, den Wahrheitsgehalt dieser Darstellungen in meinem Unwissen zu finden, was mir nicht sonderlich gut gelang. Sollten etwa die anderen doch nicht mit Wasser kochen und das, was ich so über das Thema weiß, überholtes Wissen sein? Ja, natürlich gibt es auf der einen Seite den Deep-Learning-Ansatz, der – salopp gesagt – irgendwie sowas wie die Architektur des menschlichen Gehirns auf einem künstlichen Rechnersystem nachbildet und das Ergebnis mit Beispielen füttert, auf dass es eigenständige Kategorisierungen vornehme. Ein solcher Ansatz benötigt allerdings auch in unserer Zeit schneller Desktop-PCs noch nicht-alltägliche Rechneranlagen, eine Menge Spezialisten für die Implementation und das Training neuronaler Netzwerke sowie eine hohe Frustrationstoleranz, weil relativ schwer analysierbar ist, was genau passiert und wie man Ergebnisse verbessern kann. Der Deep-Learning-Ansatz wird deswegen vor allem von großen Forschungseinrichtungen und Unternehmen eingesetzt, Google etwa hat Ray Kurzweil darauf angesetzt.

Deep-Learning-Techniken eignen sich vor allem für Aufgaben, wo Muster erkannt werden müssen, die sich nicht oder nur schwer durch spezifische Merkmale beschreiben lassen. So werden sie z. B. die Spracherkennungssyteme von iOS und Andoid eingesetzt. Soweit ich das beurteilen kann, wird der Ansatz abgesehen davon in freier Wildbahn noch kaum angewendet, weil er einfach noch nicht gut genug modellierbar ist.

Der Kochtopf mit Wasser: Maschinelles Lernen

Realweltszenarien, in denen Algorithmen eingesetzt werden, lassen sich fast alle durch Klassifikations- oder Gruppierungsproblem formulieren: Ist die Nutzerin schwanger oder nicht? Welche Kreditkonditionen bekommen die Kunden in der Gruppe, in die der potentielle Kreditnehmer eingeordnet wurde? Produkte welcher Warengruppe haben die anderen Käufer des Artikels noch erworben?  Ist der Autor des unbekannten Pamphlets Donald Rumsfeld oder der Una-Bomber? Will die Politikerin Europa – ja oder nein? Oder – wie in der Facebook-Studie damals - ist der Nutzer bzw. die Nutzerin heterosexuell oder irgendwas anderes (sic!)?

Es ist hier nicht mein Punkt, welche der möglichen Anwendungsszenarien methodisch zweifelhaft oder gar ethisch verwerflich sind. Was gemacht werden kann, wird wahrscheinlich eh irgendwo durchgeführt werden, da habe ich wenig Illusionen. Mir geht es hier nur darum, aufzuzeigen, dass dort in den seltensten Fällen neue mathematische Formeln ersonnen werden, die dann irgendwer auf dem Computer programmiert. Vielmehr steht ein ganzer Werkzeugkasten bekannter Verfahren zur Klassifikation und Gruppierung (Clustering) von Objekten zur freien Verfügung. Theoretisch könnte sich also jede|r daran bedienen und für welche Typisierungen auch immer anwenden. Mit ein wenig Geduld kommt man auch mit so mächtigen Programmen wie WEKA zurecht (da bekommt man auch eine graphische Benutzeroberfläche). Oder man ist so verwegen und installiert sich die entsprechenden Pakete für R.

Und schon ist man Data Scientist. Eigentlich, denn der Teufel liegt mal wieder … in den Daten. Um Objekte zu klassifizieren, muss man sie zunächst durch Merkmale beschreiben, jedenfalls wenn man nicht einen solchen Zauber-Neuronalen-Netzwerk-Ansatz wie oben beschrieben verfolgt. Texte kann ich z.B. beschreiben über die Wörter, die sie enthalten; Menschen über ihre Augenfarbe, ihre Größe, ihr Geschlecht, ihren Wohnort oder eben über die Bücher, die sie bisher erworben haben. Oder ich kombiniere einfach mehrere Merkmale. Und gewichte sie dann möglicherweise unterschiedlich – Augenfarbe ist wichtig, Anzahl der Muttermale etwas weniger relevant. Was auch immer ich messen oder abzählen kann, ist als Merkmal verwendbar. Schwierig ist die Mischung von Merkmalen unterschiedlicher Skalenniveaus, aber auch das ist mit ein wenig Phantasie meist lösbar. Augenfarbe könnte etwa über RGB-Werte angegeben werden – dann hätte ich statt eines nominalskalierten Merkmals gleich drei verhältnisskalierte. Diesen Vorgang – die Zuordnung von Merkmalen zu Objekten – nennt man Feature Engineering. Am Ende dieses Schrittes hat man zu jedem Objekt, das man gruppieren oder klassifizieren möchte, eine Reihe von Zahlen. Und mit diesen Zahlen kann ich dann meinen Algorithmus füttern. Bei der Gruppierung gebe ich die Objekte einfach alle hinein und bekomme am Ende Gruppen (immer hinsichtlich der ausgewählten Merkmale) homogener Objekte zurück. Das nennt man auch unüberwachtes Lernverfahren, weil ich die ursprünglichen Objekte nicht vorklassifizieren musste, um sie in Gruppen einzuteilen.

Ein weiteres bekanntes Verfahren ist das überwachter Art: Hierfür werden Trainingsobjekte benötigt, die bereit vor Anwendung des Algorithmus mit ihrer Klasse versehen sind (+/-schwanger, Text von Rumsfeld, Text vom Una-Bomber etc). Über diese Trainingsobjekte bildet sich der Algorithmus ein Modell, das er zu Rate zieht, wenn er weitere, nicht vorausgezeichnete Objekte zuweisen soll.

Was ich eigentlich damit sagen will

Hinter dem was landläufig als Algorithmen bezeichnet wird, die einen immer größeren Einfluss auf unser Leben haben, verbergen sich meist maschinelle Lernverfahren. In denen steckt zwar ein wenig was an Mathematik drin, vor allem bei der Gewichtung von Merkmalen, bei der Distanzberechnung von Merkmalskombinationen und eben bei der Gruppierung oder Klassifikation. Dies sind aber in den meisten Fällen frei zugängliche Formeln oder gar fertige Implementationen, die über graphische Oberflächen von eigentlich jedem zu bedienen sind. Manche dieser Verfahren liefern für bestimmte Anwendungsfälle bessere, für andere wieder schlechtere Ergebnisse. Zumindest in meinem Bereich, der Computerlinguistik, lässt sich meist schwer voraussagen, welche der Kombinationen gut funktioniert. Man probiert halt einfach alle aus und schaut dann, welche am besten performt (ja, manchmal sind wir halt einfach Ingenieure).

Mit das Wichtigste für die Funktion der Verfahren ist allerdings die Auswahl an Merkmalen, mit denen die Objekte beschrieben werden. Und anstatt darüber zu mosern, dass Algorithmen Entscheidungen für oder über uns treffen, sollte man vielleicht besser darauf drängen, offenzulegen, auf welcher Grundlage sie dies tun. Welche Merkmale erhebt die Schufa? Liest Amazon meine History aus oder beruhen die Empfehlungen nur auf den Daten, die ich ihnen gegeben habe? Vor allem: Kann ich das abschalten? Was der Algorithmus dann hinterher draus macht, kann ja auch mal hilfreich sein. Demnächst hoffentlich hier an einem konkreten Beispiel gezeigt.

Quelle: http://texperimentales.hypotheses.org/1111

Weiterlesen

Bundeskabinett beschließt Digitale Agenda 2014-2017

Die Bundesregierung hat heute ihre Digitale Agenda für die Jahre 2014 bis 2017 verabschiedet, die unter dem schönen Motto “Die Chancen der Digitalisierung nutzen” steht.

2014-08-20-digitale-agendaWas uns besonders freut: auf Platz eins der identifizierten Handlungsfelder stehen die digitalen Infrastrukturen. Man darf also gespannt sein.

Die offizielle Pressemitteilung zu Zielen und Handlungsfeldern sowie mit Aussagen der Minister Gabriel, de Maizière und Dobrindt findet sich auf den Seiten des Bundesministeriums für Verkehr und digitale Infrastruktur unter: http://www.bmvi.de/SharedDocs/DE/Pressemitteilungen/2014/068-dobrindt-digitale-agenda.html?linkToOverview=DE%2FPresse%2FPressemitteilungen%2Fpressemitteilungen_node.html%23id134654

 

Quelle: http://dhd-blog.org/?p=3913

Weiterlesen

Genealogische Quellen in Privatarchiven Teil 2 (von Werner Frese)

AssenG597_2Manche Gutsherrschaften waren gleichzeitig Inhaber von Gerichtsherrlichkeiten oder fungierten auch als Holz- oder Markenrichter. In den Protokollen der unterherrlichen Gerichtsbarkeiten werden überwiegend zivile Streitigkeiten abgehandelt, z. B. Schuldforderungen, die sehr langlebig sein können und deshalb nicht selten eine diesbezügliche Erb- und genealogische Abfolge darstellen, die für den Genealogen höchst aufschlussreich sind, besonders, wenn es um Erbstreitigkeiten, Kindesabfindungen und Brautschatz-, Unterhaltszahlungen geht. Viel häufiger sind Fälle der Strafgerichtsbarkeit, die nicht nur sehr genau die Beteiligten in Injurienklagen und bei tätlicher Gewalt angeben, sondern auch Zeugen mit ihrem Alter und ihrer Profession und häufig genug den Verwandtschaftsverhältnissen. Hier kommen natürlich nicht nur die Eigenhörigen vor, sondern es können theoretisch alle der Gerichtsbarkeit Unterworfenen und solche, die das Gericht als Kläger angerufen haben, namentlich vorkommen. Dasselbe gilt für die Markenprotokolle, wobei die Gegenstände sich natürlich stets auf die Markennutzung beziehen.

In allen Privatarchiven finden sich zahlreiche Prozesse, die die Gutsherrschaft mit den eigenbehörigen Bauern in Forderungssachen geführt hat. Auch diese greifen meist weiter zurück und geben Blicke auch auf  Zeiten frei, die lange vor dem eigentlichen Prozessbeginn liegen, und somit frühere Verhältnisse des Hofes und der aufsitzenden Menschen beleuchten.

 

Coe K_980_002_RegisterWenn die Gutsherrschaft mit mehreren Höfen in einem Kirchspiel begütert war, lassen sich in ihrem Archiv nicht selten Rechnungen des Kirchspiels finden und sogar Kirchspielsschatzungen (Steuerlisten), deren überwiegende Menge natürlich in der landesherrlichen Verwaltung anzutreffen ist. Hatten die Adelsherrschaften auch Kirchenpatronate, finden sich natürlich in ihrem Archiv auch die Kirchenrechnungen, die besonders für das gesamte kirchliche Personal bis zur Hebamme ergiebig sind. Man darf überhaupt davon ausgehen, dass die Rechnungsregister aller Art sehr viel auskunftsfreudiger als heute sind, die genauen Umstände und Leistungen für Zahlungen angeben und natürlich namentlich deren Empfänger oder Rechtsnachfolger. Lohnenswert, wenngleich mühseliger, ist daher auch die Durchsicht der Rechnungsbelege der Kaufleute, Handwerker, Apotheker, Ärzte, Künstler

Bei geistlichen Institutionen und Stiftern, deren Überlieferung durch die Säkularisation in die Archive der Standesherren geraten sind, ist aufmerksam zu machen auf die Kapitelsprotokolle. Diese erfassen, ganz anders als zunächst ihre Bezeichnung vermuten lässt, weniger geistliche Angelegenheiten als vielmehr fast alle Geschäfte der gutsherrlichen Verwaltung des Klosterbesitzes, wie sie bereits oben dargestellt worden sind. Ergiebig sind besonders die mancherorts darin verzeichneten Vergaben der Wortstätten, aus denen sich zuweilen lückenlose Hausgeschichten und Abfolgen ihrer Bewohner erstellen lassen.

Plettenberg_1Vom Gutsarchiv ist das Familienarchiv der adligen Familien zu unterscheiden. Hier wurden insbesondere Eheberedungen, Testamente und Abfindungen der nachgeborenen Kinder aus rechtlichen Gründen aufbewahrt. Zur Durchsetzung von Erbansprüchen waren nicht selten langwierige Prozesse nötig, in denen die Abstammungsverhältnisse durch graphische Schemata dargestellt, aber auch durch Urkunden belegt wurden. Adelsfamilien, deren Söhne Domherrenstellen besetzten oder Töchter in Stiftern untergebracht wurden, besitzen nicht selten die Aufschwörungstafeln der Probanden, die ihre adlige Herkunft über vier Generationen beweisen. Seit dem 19. Jahrhundert haben einige Archivare bei Neuordnungen des Archivs sogar Personalakten gebildet, in denen von der Taufurkunde bis zu Patenten und Bestallungsurkunden sogar bedeutsame Korrespondenzen der betreffenden Personen vereinigt liegen.

Quelle: http://archivamt.hypotheses.org/734

Weiterlesen

Audienz bei einem Geächteten

Das Schicksal Friedrichs V. von der Pfalz berührt vordergründig nur die Anfangsphase des Dreißigjährigen Kriegs: zunächst als pfälzischer Kurfürst einer der wichtigsten Reichsfürsten, dann König von Böhmen, um kurz darauf geächtet und als „Winterkönig“ verspottet alles zu verlieren und ins Exil nach Den Haag zu gehen. Bei den Generalstaaten hatte er zwar Zuflucht gefunden, doch seine Machtgrundlagen waren verschwunden. Gleichwohl setzte er in den folgenden Jahren alles daran, um auf die politische Bühne des Reiches zurückzukehren, die pfälzischen Besitzungen und ebenso auch die böhmische Krone wiederzugewinnen. Immerhin gab es noch Kriegsunternehmer wie Mansfeld und Christian von Braunschweig, die vorgaben, für die Sache des Pfälzers zu streiten, und nach wie vor flossen Gelder aus Frankreich, England und den Niederlanden, um diese Feldzüge zu finanzieren.

Auf der kaiserlichen Seite sah die Sache anders aus. Für Ferdinand II. und dem mit ihm verbündeten Maximilian von Bayern mitsamt der Liga war Friedrich nur der „exilierte Pfalzgraf“. Mit einem Reichsächter konnte man keinen Umgang haben, als politischer Faktor war Friedrich rechtlich betrachtet ausgeschaltet. Und Maximilian, der Friedrichs pfälzische Kurwürde nach Bayern transferiert hatte, dachte gar nicht daran, den Exilierten durch diplomatische Kontakte aufzuwerten. Doch war nicht zu übersehen, daß man über die Machenschaften in Den Haag Bescheid wissen mußte. Was ging am Hof des exilierten Rex Bohemiae vor? Das wollte man schon gerne erfahren, doch durfte dies nicht über offizielle Kanäle erfolgen.

Es gab aber einen indirekten, eleganteren Weg. Ferdinand, als Bruder Maximilians von Bayern, unterhielt einen eigenen Agenten in Den Haag. Damit war kein Geheimdienstler gemeint, sondern ein diplomatischer Vertreter auf ganz niedriger Stufe – das war zum einen hinsichtlich des repräsentativen Aufwands billig und zum anderen politisch unverfänglich. Dieser Agent versorgte Ferdinand, der als Kurfürst von Köln unmittelbarer Nachbar der Generalstaaten war, permanent mit Nachrichten über die aktuellen Vorgänge in Den Haag und kümmerte sich auch um kurkölnische Belange bei den Generalstaaten. Er sollte nun auch auf den Pfalzgrafen ein Augenmerk haben.

Tatsächlich knüpfte dieser Agent namens Johann van der Veecken Kontakte zum Gefolge des Pfalzgrafen. Ja, mitunter berichtete er sogar von direkten Gesprächen mit Pfalzgraf Friedrich selbst. Berichte über diese Audienzen schickte er dann an Kurfürst Friedrich – der die wirklich brisanten Informationen über den exilierten Friedrich gleich exzerpierte und nach München weitersandte. Auf pfälzischer Seite wird man schon gewußt haben, welche Dimension diese Gespräche mit Veecken hatten; wer weiß, was man dort alles lanciert hatte, im sicheren Bewußtsein, daß diese über kurz oder lang doch bei Maximilian von Bayern landen würden.

Jedenfalls entwickelten sich hier auf ganz unverfängliche Weise Kontakte zwischen den mächtigen Fürsten im Reich und dem Geächteten im Haager Exil – Kontakte, die es eigentlich gar nicht geben durfte, die aber trotzdem für beide Seiten wichtig waren. Ich habe vor Jahren schon einmal dieses Themen im Umfeld der bayerischen Pfalzpolitik gestreift (im Katalog zum „Winterkönig“ von 2003), will mich demnächst aber noch einmal intensiver mit der Figur des kurkölnischen Agenten Veecken auseinandersetzen.

Quelle: http://dkblog.hypotheses.org/514

Weiterlesen

aventinus studiosa Nr. 6 [19.08.2014]: Online-Tutorium Mittelalterliche Geschichte der Eberhard-Karls-Universität Tübingen

http://www.mittelalter.uni-tuebingen.de/?q=tutorium/start.htm Das Online-Tutorium bietet einen Überblick zu den wichtigsten Bereichen und Techniken Wissenschaftlichen Arbeitens, die für einen Mittelalterhistoriker unerlässlich sind. Erfreulicherweise liegen die letzten Aktualisierungen gerade erst ein Jahr zurück.

Quelle: http://www.einsichten-online.de/2014/08/5310/

Weiterlesen

The genesis and emergence of Education 3.0 in higher education and its potential for Africa, v. Derek Keats / J. Philipp Schmidt

http://firstmonday.org/ojs/index.php/fm/article/view/1625/1540 This paper presents a scenario in which education is approaching a potential tipping point, where major changes are about to happen as a result of developments in technology, social networking, deeper understanding of educational process, as well as new legal and economic frames of reference. The set of changes constitute what we refer to […]

Quelle: http://www.einsichten-online.de/2014/08/5306/

Weiterlesen

Das IfZ sucht private Dokumente aus dem Alltag im NS-Regime

Briefsammlung

Für das Forschungsprojekt „Das Private im Nationalsozialismus“ sucht das Institut für Zeitgeschichte Dokumente aus den Jahren 1933 bis 1945, die Einblick in den Alltag der Menschen im NS-Staat geben. Das können Tagebücher, Erinnerungen, Familienchroniken oder Briefe sein, aber auch Fotografien und Fotoalben.

Wir vermuten solche Dokumente in persönlichen Hinterlassenschaften und freuen uns über jedes Stück, das der Wissenschaft zur Verfügung gestellt wird.

Was wird gesucht?

Zu drei Spezialstudien sind wir konkret an Dokumenten und Zeugnissen aus der Zeit von 1933 bis 1945 zu folgenden Themen interessiert:

Fronturlaub: Erfahrungen des Wehrmachtsoldaten und seiner Angehörigen vor, im und mit dem Aufenthalt in der Heimat
Schwangerschaft und Mutterschaft in den ersten beiden Lebensjahren des Kindes sowie verwandte Themen wie Sexualität, Verhütung und Abtreibung

Gerichtsverfahren: juristische Auseinandersetzungen aus dem privaten Bereich, vor allem Ehescheidungen, aber auch Pfändung und Zwangsvollstreckung

Ansprechpartnerin

Dr. Esther-Julia Howell
Stellvertretende Archivleiterin
Telefon: +49 89 12 688-127 (Mo-Do 8-16 Uhr, Fr 8-12 Uhr)
E-Mail: howell@ifz-muenchen.de

Nähere Informationen auf der Projekt-Homepage.

Quelle: http://archive20.hypotheses.org/1992

Weiterlesen