Strukturierung des Gegenstandsbereichs Whiskysorten mit Hilfe von Textmining

URL
Dokumentart: Masterarbeit
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2018
Publikationsdatum:
SWD-Schlagwörter: Text Mining
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

Diese Arbeit befasst sich mit der Herausforderung einer Whisky-Empfehlungsgebung. Es soll die Grundlage für ein fiktives Whisky-Empfehlungssystem geschaffen werden. Konkret ist das Ziel, eine maschinenlesbare Repräsentation von Wissen über geschmackliche Distanzen von Whiskys zu generieren. Zu diesem Zweck wird ein KDD-Prozess festgelegt, welcher auf die Domäne und die verfügbaren Daten zugeschnitten ist. In diesem finden verschiedene Techniken aus dem Text Mining und die Genrerierung von Word Embeddings Anwendung. Ein besonderer Fokus liegt dabei auf der Vorverarbeitung der verwendeten Daten zur Verbesserung der Embeddings. Nach einer Generierung von Repräsentationen von Whiskys, welche Distanzberechnungen erlauben, können Empfehlungen auf Grundlage dieser Distanzen gegeben werden. Diese Empfehlungen werden abschließend im Rahmen der Evaluation durch einige Experten im Hinblick auf ihre Nachvollziehbarkeit bewertet.

Kurzfassung auf Englisch:

This thesis addresses the challenge of whisky recommendations. Its goal is to create the basis for a fictional whisky recommendation system. Specifically, the goal of this thesis is to create a machine-readable representation of knowledge about the distances of whiskies regarding their flavour. For this purpose, a KDD process is defined, which is tailored to the domain and the existing raw data. This includes the use of word embeddings. Different techniques from the field of text mining are applied in the process. A special focus lies on preprocessing the raw text data to improve the resulting word embeddings. After generating representations of whiskies that allow distance calculations, recommendations can be made based on those distances. Finally, these recommendations are assessed in terms of their comprehensibility by several experts as part of the evaluation.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.