Entwicklung eines Ähnlichkeitsmaßes für natürlichsprachige Texte

URL
Dokumentart: Bachelor Thesis
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2019
Publikationsdatum:
SWD-Schlagwörter: Sprachverarbeitung
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

Diese Bachelorarbeit befasst sich damit, beurteilen zu können, inwieweit zwei Texte als ähnlich betrachtet werden können. Dabei werden zunächst die theoretischen Grundlagen sowie Methoden präsentiert und anschließend ein System vorgestellt, welches die Fähigkeit von verschiedenen Modellen, Textähnlichkeit zu bestimmen, bewerten soll. Abschließend werden die einzelnen Modelle miteinander verglichen.

Kurzfassung auf Englisch:

This bachelor thesis deals with the question of how two texts can be regarded as similar. First, theoretical concepts and methods are presented and then a system is introduced to evaluate the capability of different models to determine text similarity. Finally, the respective models are compared with each other.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.