Entwurf und Realisierung eines Information Extraction Systems für Formel-1-Berichte mithilfe des Sprachverarbeitungs-Frameworks UIMA

URL
Dokumentart: Bachelor Thesis
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2012
Publikationsdatum:
SWD-Schlagwörter: Information Extraction
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

Diese Arbeit befasst sich mit der Erstellung eines Prototyps für das Extrahieren von Informationen aus Formel-1-Berichten. Für diese Zwecke wird das Framework UIMA verwendet, mit dem vereinfacht Informationsextraktionsprogramme entwickeln und diese Programme verwaltet werden können. Es werden die grundlegenden Konzepte der Informationsextraktion beschrieben. Auf diese Konzepte aufbauend wurde dann ein dynamischer Prototyp erstellt, mit dem es möglich ist, Datum, Ort, Gewinner, Unfälle und Ausfälle eines Rennens einem Formel-1-Berichten zu entnehmen.

Kurzfassung auf Englisch:

This Paper is about the creation and development of a prototype for information extraction from formula 1 reports. UIMA, which is used here, is an architecture and software framework for creating, discovering, composing and deploying a broad range of multi-modal analysis capabilities and integrating them with search technologies. Basic concepts of information extraction are explained. A dictionary and an easy to configure rule concept is developed, which uses natural language. With the use of this concept a dynamic prototype is created, which is able to extract dates, locations, winner, crashs and malfunctions from a formula 1 race report. Finally the developed rules are checked and it will be shown, how the adding of rules will change the results.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.