Fulltext available Open Access
License: 
Title: Konsolidierung von kontrollierten Vokabularen im Text Mining
Language: German
Authors: Shi, Xiaoyu 
Keywords: kontrolliertes Vokabular; Python; Pandas; Jupyter Notebook; Konsolidierung
Issue Date: 7-May-2019
Abstract: 
Diese Arbeit beschäftigt sich mit der Frage, wie mit der Python-Bibliothek „Pandas“ die kontrollierten Vokabulare des Text-Mining-Projekts mit dem Titel „Schaffung von mehr Transparenz in der Bundestagswahl 2017“, das von Prof. Dr. Susanne Glissmann im Wintersemester 2017 am Department Information an der Hochschule für Angewandte Wissenschaften (HAW) geleitet wurde, konsolidiert werden können.
Nach der Beschreibung der theoretischen Grundlagen zu „Korpus“, dem kontrollierten Vokabular der Python-Bibliothek Pandas, und der Konsolidierung wird das Vorgehen zur Konsolidierung kontrollierter Vokabulare vorgestellt. Es gibt insgesamt 19 kontrollierte Vokabulare-Excel-Dateien, die zusammengeführt und aufbereitet werden. Der dabei genutzte Code wird mit der Python-Bibliothek „Pandas“ in der interaktiven Entwicklungsumgebung Jupyter Notebook erstellt. Das finale konsolidierte kontrollierte Vokabular ist im politischen Bereich nützlich und wertvoll. Die dazu entwickelten Skripte sind zur Analyse von Massendaten anderer Text-Mining-Projekte wiederverwendbar.
Für die Nutzung der Python-Bibliothek „Pandas“ ist keine Programmiererfahrung erforderlich.
URI: http://hdl.handle.net/20.500.12738/8724
Institute: Department Information 
Type: Thesis
Thesis type: Bachelor Thesis
Advisor: Glissmann-Hochstein, Susanne 
Referee: Büschenfeldt, Maika 
Appears in Collections:Theses

Files in This Item:
File Description SizeFormat
Xiaoyu_Shi_Bachelorarbeit.pdf1.99 MBAdobe PDFView/Open
Show full item record

Page view(s)

195
checked on Apr 23, 2024

Download(s)

269
checked on Apr 23, 2024

Google ScholarTM

Check

HAW Katalog

Check

Note about this record


Items in REPOSIT are protected by copyright, with all rights reserved, unless otherwise indicated.