#lis Web Information Retrieval Technologien zur Informationssuche im Internet, von Dirk Lewandowski

http://www.bui.haw-hamburg.de/fileadmin/user_upload/lewandowski/doc/Web_Information_Retrieval_Buch.pdf Lewandowskis „Web Information Retrieval“ widmet sich den Grundlagen der Suchmaschinen im Internet. Gegenstände seiner Arbeit sind erstens die bei den Web-Suchmaschinen derzeit eingesetzten sowie in der Literatur diskutierten Retrievalmethoden sowie zweitens eine Schwachstellenanalyse. Bei erkannten Defiziten (und die gibt es zahlreich) unterbreitet Lewandowski zudem Vorschläge zur Behebung. Eine Detailanalyse der Suchmaschinenalgorithmen aus mathematischer und […]

Quelle: https://www.einsichten-online.de/2018/11/9928/

Weiterlesen

Datenschutz und Geschichtswissenschaften

An der infoclio-Tagung 'Datenschutz und Geschichtswissenschaften' wurde v.a. von Sacha Zala auf das Problem aufmerksam gemacht, dass zwar immer mehr Daten veröffentlicht werden, aber gleichzeitig der Zugriff darauf massiv eingeschränkt wird. Selbst Daten, welche offiziell der Öffentlichkeit zugänglich gemacht werden müssen (bspw. Bundesratsentscheide nach 30 Jahren), können im Archiv, aber nicht im Internet eingesehen werden. Dort sind sie noch immer geschützt.

Die aufgeworfenen Probleme zu Persönlichkeitschutz, Datenschutz und Forschungsfreiheit betreffen die Forschenden vor allem in der Heuristik. Wie sollen Datenbestände durchforstet werden? Wie kann man sicher sein, dass nicht doch ein Bestand aus irgendeinem (relevanten oder irrelevanten) Grund nicht digitalisiert zur Verfügung steht? Vielleicht digitalisiert wurde, aber hinter einer 'Zensurwand' steckt? Wie lange kann auf einen relevanten Bestand zugegriffen werden?

Der Fall vor dem EuGH bzgl. Google und das Recht auf Vergessen hat aufgezeigt, dass das Persönlichkeitsrecht als sehr hoch gewichtet wird. Der Aufschrei, dass damit 'Zensur' geübt wird und die Meinungs- und Pressefreiheit eingeschränkt wird, ist zu relativieren. Unerheblich davon, wie das Urteil umgesetzt wird oder werden kann, es muss jeder Person selbst überlassen sein, wie gläsern er sein will.

Hierzu scheint es sinnvoll zwischen einer 'ungerichteten' und einer 'gerichteten' Suche zu differenzieren:

  • Bei einer ungerichteten Suche werden mittels digitalen Suchmaschinen grosse/riesige Datenbestände über einen grossen Zeitraum durchsucht (Big Data). Beziehungen zwischen Daten können sehr einfach geknüpft werden. Persönlichkeitsprofile mit detaillierten Auskünften über den ganzen Lebenszeitraum sind erstellbar.
  • Bei einer gerichteten Suche wird bei bestimmten Institutionen in deren spezifischen (digitalen) Datenbanken, Archiven, Bibliotheken etc. gesucht. Die Suche benötigt ein Vorwissen, eine entsprechende Ausbildung und einen intellektuel hohen Beitrag. Auch hier sind Beziehungen zwischen Daten und ein Persönlichkeitsprofil erstellbar, aber mit einem viel grösseren Aufwand.

Es sei die These aufgestellt, dass bei Entscheiden für das Recht auf Vergessen vor allem gegen die Einfachheit der Erstellung von Persönlichkeitsprofilen votiert wurde. Das Fehlen des intellektuel hohen Beitrages (und damit der Reflexion über die vorhandenen Daten und die erstellten Verknüpfungen) ist meines Erachtens der Grund, warum 'Big Data Search' eingedämmt werden sollte, unerheblich der technischen Machbarkeit. Die bestehenden Daten sollen weiterhin zur Verfügung gestellt, aber dürfen nicht datenbestandsübergreifend durchsucht werden können - zumindest während einer klar definierten Sperrfrist. Es wäre damit zu hoffen, dass die veröffentlichten Datenbestände weiter zunehmen, damit für Forschende auch mehr Informationen zur Verfügung stehen, aber die Restriktionen wieder abnehmen werden.

Quelle: http://hsc.hypotheses.org/311

Weiterlesen

Der Altavista lebt! … (und der Lycos und der Hotbot auch)

So höret Ihr Kinder, ich will Euch erzählen von alter Zeit. Es gibt einige ältere Mitbürger/innen unter uns, die mit “Altavista” nicht eine Outdoor-Sportmarke, ein Brillenfachgeschäft oder ein Arnold-Schwarzenegger-Zitat1 assoziieren. Denn, oh ja, es war einmal eine Zeit, als in den Bibliotheken noch Zettelkästen stunden und die tapfersten und aufgewecktesten der jungen Generation, geschmacklos in […]

Quelle: http://weblog.hist.net/archives/6575

Weiterlesen

«Suchmaschinen» avant la lettre?

Ausschnitt aus Illustration “Kapitän Nemo nimmt den Höhenstand der Sonne auf”1 Interessant, was ich bei der Lektüre von Jules Vernes “20 000 Meilen unter dem Meer” entdecke: Der Kapitän Nemo, ohne mir zu antworten, winkte mir, ihm in den großen Saal zu folgen. Der Nautilus tauchte einige Meter unter das Wasser, und die Läden öffneten [...]

Quelle: http://weblog.hist.net/archives/5376

Weiterlesen

Google goes Facebook?

Bevor Kollega Hodel wieder einen seiner berüchtigten Erstaprilscherze hier ablässt, hier noch eine seriöse Meldung, die ich heute aus der News-Flut gefischt habe und die mich etwas nachdenklich gestimmt hat: Verschiedenen Berichten zu Folge führt Google eine neue Funktion ein, welche es den Nutzer/innen ermöglicht, Anzeigen und später auch Treffer zu «liken». So wie bei [...]

Quelle: http://weblog.hist.net/archives/5191

Weiterlesen