Merkmalsextraktion durch Methoden des unüberwachten maschinellen Lernens zur Klassifikation von Aerosol-Rückstreuprofilen aus LIDAR-Ceilometern

Unsupervised Machine Learning: Feature Extraction for Classification of LIDAR-Ceilometer Aerosol-Backscatter Profiles

URL
Dokumentart: Bachelor Thesis
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2019
Publikationsdatum:
SWD-Schlagwörter: Cluster
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

In dieser Bachelorarbeit wird ein Verfahren zur unüberwachten Merkmalsextraktion aus Aerosol-Rückstreuprofilen vorgestellt. Hierbei werden LIDAR-Ceilometer Messdatensätze zuerst einer Vorverarbeitung unterzogen, um dann mithilfe eines Convolutional-Autoencoders in komprimierte Merkmalsvektoren überführt zu werden. Auf Basis dieser Merkmalsvektoren findet ein initiales Clustering statt, welches durch Minimierung der KL-Divergenz zu einer gewählten Zielverteilung weiter optimiert wird. Zwei Experimente, zunächst auf dem MNIST-Zifferndatensatz und im Anschluss mit realen Ceilometerdaten, haben die Funktionsfähigkeit des Ansatzes bestätigt. Erfolgreich konnten so einige meteorologische Phänomene in Clustern gruppiert und halbautomatisch mit Labels versehen werden. Neben den Implementationsdetails des Verfahrens werden außerdem einige Eigenschaften der vorliegenden Messdaten besprochen sowie ein umfangreicher Ausblick auf weitere Forschung in diesem Gebiet gegeben.

Kurzfassung auf Englisch:

In this bachelor thesis a method for unsupervised feature extraction from aerosol backscatter profiles is proposed. After a first data preprocessing step the LIDAR-ceilometer datasets are converted into an compressed representation using an convolutional autoencoder. These encoded representations are then used for the computation of an initial cluster assignment which gets further optimized, trough minimizing the KL-divergence to an arbitrary target distribution, during consecutive training. Two experiments, the first based on the MNIST database of handwritten digits and the second based on real ceilometer aerosol backscatter data, were successfully executed. The proposed method has been successfully utilized, in order to group some meteorological phenomena into clusters which then labels were assigned to. In addition to the description of implementation details, multiple aspects of the ceilometer datasets are analyzed and a comprehensive outlook to further possible research in this field is given.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.