Konsolidierung von kontrollierten Vokabularen im Text Mining

URL
Dokumentart: Bachelor Thesis
Institut: Department Information
Sprache: Deutsch
Erstellungsjahr: 2017
Publikationsdatum:
SWD-Schlagwörter: Text Mining
Freie Schlagwörter (Deutsch): kontrolliertes Vokabular, Python, Pandas, Jupyter Notebook, Konsolidierung
DDC-Sachgruppe: Bibliotheks- und Informationswissenschaft

Kurzfassung auf Deutsch:

Diese Arbeit beschäftigt sich mit der Frage, wie mit der Python-Bibliothek „Pandas“ die kontrollierten Vokabulare des Text-Mining-Projekts mit dem Titel „Schaffung von mehr Transparenz in der Bundestagswahl 2017“, das von Prof. Dr. Susanne Glissmann im Wintersemester 2017 am Department Information an der Hochschule für Angewandte Wissenschaften (HAW) geleitet wurde, konsolidiert werden können. Nach der Beschreibung der theoretischen Grundlagen zu „Korpus“, dem kontrollierten Vokabular der Python-Bibliothek Pandas, und der Konsolidierung wird das Vorgehen zur Konsolidierung kontrollierter Vokabulare vorgestellt. Es gibt insgesamt 19 kontrollierte Vokabulare-Excel-Dateien, die zusammengeführt und aufbereitet werden. Der dabei genutzte Code wird mit der Python-Bibliothek „Pandas“ in der interaktiven Entwicklungsumgebung Jupyter Notebook erstellt. Das finale konsolidierte kontrollierte Vokabular ist im politischen Bereich nützlich und wertvoll. Die dazu entwickelten Skripte sind zur Analyse von Massendaten anderer Text-Mining-Projekte wiederverwendbar. Für die Nutzung der Python-Bibliothek „Pandas“ ist keine Programmiererfahrung erforderlich.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.