Stabilisierung unkontrollierter Flugzustände mit Reinforcement Learning

Stabilization of uncontrolled flight states with reinforcement learning

URL
Dokumentart: Masterarbeit
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2019
Publikationsdatum:
SWD-Schlagwörter: Operante Konditionierung
Freie Schlagwörter (Englisch): reinforcement learning, deep deterministic policy gradient, experience replay memory, curriculum learning, quadcopter
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

Reinforcement Learning ermöglicht einem selbstlernenden Agenten ein unbemanntes Flugobjekt in unkontrollierten Flugzuständen zu stabilisieren. Um dies zu erreichen, wird ein Deep Deterministic Policy Gradient Algorithmus angewendet. Durch Erweiterung wie Experience Replay Speicher, parametrisiertem Rauschen, Prioritized Experience Replay, Hindsight Experience Replay und Curriculum Learning lassen sich darüberhinaus Umgegebung mit sparse Reward trainieren.

Kurzfassung auf Englisch:

Reinforcement learning allows a self-learning agent to stabilize an unmanned aerial vehicle in uncontrolled flight states. To achieve this, a deep deterministic policy gradient algorithm is applied. Through extensions like experience replay memory, parameterized noise, prioritized experience replay, hindsight experience replay and curriculum learning, it is furthermore possible to train environments with sparse reward.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.