Integration von Information Retrieval Funktionalität in eine offene persistente Programmierumgebung

URN urn:nbn:de:gbv:18-228-7-1076
URL
Dokumentart: Report (Bericht)
Schriftenreihe: Mitteilungen des Fachbereichs Informatik der Universität Hamburg
Bandnummer: 257
Sprache: Deutsch
Erstellungsjahr: 1996
Publikationsdatum:
SWD-Schlagwörter: Information Retrieval , Datenbank
Freie Schlagwörter (Englisch): Information Retrieval, Database
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.00 , 54.89 , 54.29

Kurzfassung auf Deutsch:

Verfahren zur automatisierten Gewinnung von Informationen (Information Retrieval) aus umfangreichen, elektronischen Textdatenbanken sind seit mehr als drei Jahrzehnten Gegenstand wissenschaftlicher Untersuchungen. Die Anforderungen dieses Forschungsgebietes unterscheiden sich grundlegend von den Gegebenheiten im Bereich herkömmlicher Datenbanken. Während im Datenbankbereich die Repräsentation der Daten und damit auch die Ergebnisse eindeutig sind, unterliegen sie im Information Retrieval der Unschärfe. Der Grund für diese Unschärfe ist die Vielfalt der natürlichen Sprache, die den Textdatenbanken zugrundeliegt. Ein und derselbe Sachverhalt kann in unzähligen Facetten ausgedrückt werden. Kommt ein Wort in unterschiedlichen Texten vor, so kann es immer wieder eine andere Bedeutung tragen. Um trotz der semantischen Fülle der natürlichen Sprache im Information Retrieval verwertbare Ergebnisse erzielen zu können, wurde eine Vielzahl an Konzepten entwickelt, um natürlichsprachliche Inhalte formal möglichst unverfälscht darzustellen. Mittlerweile beeinflussen andere, weiterführende Aspekte die Forschung auf dem Gebiet des Information Retrieval. Texte werden inzwischen fast ausschließlich am Rechner erstellt, so daß sie dem Information Retrieval in viel gröierer Zahl zur Verfügung stehen als noch vor einigen Jahren. Hinzu kommt, dai inzwischen globale Weitverkehrsnetze bestehen, die den Austausch von Daten zwischen nahezu beliebigen Orten auf der Welt ermöglichen. Die textuelle Repräsentation ist hierbei nicht mehr die einzige Form, in der Inhalte gespeichert werden. Das Schlagwort "Multimedia" drückt aus, daß andere Datenrepräsentationen, wie beispielsweise Grafik, Video oder Audio, mehr und mehr an Bedeutung gewinnen. Ein modernes Retrieval System kann somit aus einem Pool verschiedener Daten, die an den verschiedenen Stellen abgelegt sind, schöpfen. Hierdurch bleibt die Forschung auf dem Sektor des Information Retrieval nicht auf bloße linguistische Fragestellungen beschränkt. Um den veränderten Umständen gerecht zu werden, sind verteilte und hochgradig polymorphe Systeme zu realisieren. Die vorliegende Arbeit stellt einen Schritt in diese Richtung dar. Neben der Nennung bekannter Konzepte des Information Retrieval beschreibt sie die Anbindung des probabilistischen Retrieval Systems INQUERY an die Systementwicklungsumgebung Tycoon. Durch die Eigenschaften Persistenz, Polymorphismus und Interoperabilität, die dem Tycoon System zu eigen sind, werden Grundlagen für eine moderne Art des Information Retrieval geschaffen.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.