Vergesslichkeit des Netzes : Überprüfung des Informationsverlustes im deutschsprachigen World Wide Web anhand einer Untersuchung der externen Links unterschiedlicher Web-Genres

URL
Dokumentart: Bachelor Thesis
Institut: Department Information
Sprache: Deutsch
Erstellungsjahr: 2013
Publikationsdatum:
SWD-Schlagwörter: World Wide Web , Information , Verlust
DDC-Sachgruppe: Bibliotheks- und Informationswissenschaft

Kurzfassung auf Deutsch:

Das deutschsprachige Web vergisst. Die vorliegende Arbeit betrachtet dieses Thema ausschließlich für das öffentlich frei zugängliche Web. Keine sozialen Netzwerke, wie Facebook oder StudiVZ oder andere Bereiche, die durch Passwörter geschützt sind, fließen in die Arbeit mit ein. Stattdessen wird aus anderen unterschiedlichen Web-Genres eine breitgefächerte Sammlung aus externen Links angelegt. Diese können auf ihre Erreichbarkeit geprüft und dem Jahr zugeordnet werden, in dem sie erstellt sind. Auf dieser Grundlage erfolgt die Überprüfung des Informationsverlustes und der Vergesslichkeit im deutschsprachigen Web. Das Vergessen wird dazu in zwei Stufen eingeteilt. Die erste Stufe sind die gebrochenen Links. Im Schnitt steigt die Zahl der fehlerhaften Verweise jedes Jahr um 5,7% im deutschsprachigen Web an. Verlinkungen aus dem Jahr 2007 funktionieren mit einer Wahrscheinlichkeit von etwa 40% nicht mehr. Auch die Stichproben aus 2013 enthalten mit ca. 3% inkorrekte Verweise. Die zweite Stufe des Vergessens beschreibt den konkreten Informationsverlust. Die Ergebnisse zeigen, dass je älter das Web wird umso mehr Inhalte nicht mehr auffindbar sind. Der Anstieg beträgt 0,66% pro Jahr, von ca. 1,5% 2013 auf den Höchstwert von knapp 6% im Jahr 2008. Der Informationsverlust ist also sehr gering. Es kommt eher zu einer ständigen Umstrukturierung der Inhalte. Einige sind schwerer wiederzuentdecken, andere leichter. Technische Hilfsmittel erleichtern die Recherche. Das Internetarchiv archive.org speichert etwa zwei Drittel des deutschsprachigen Webs ab und selbst die Informationen, die dort nicht zu finden sind, kann eine Suchmaschine noch mit einer Wahrscheinlichkeit von fast 50% entdecken. Diese Werte sind allerdings nur Annahmen auf Grundlage der über 11.000 Links großen Stichprobe. Das Web ist in seiner Grundgesamtheit nicht zu erfassen. Eine Repräsentativität ist daher nicht gegeben. Ein Punkt ist aber deutlich. Gebrochene Links sollten als Problem angesehen werden. Seitenbetreiber können aber mithilfe des in der Arbeit vorgestellten Maßnahmenkatalogs diese Entwicklung einschränken. Die einzelnen Schritte lauten: Im Rahmen von Recht und Gesetz die Inhalte der externen Verweise sichern, diese Seiten in bestimmten Abständen überprüfen und regelmäßig gebrochene Hyperlinks korrigieren.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.