German Word Level Lip Reading with Deep Learning

URL
Dokumentart: Bachelor Thesis
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2019
Publikationsdatum:
SWD-Schlagwörter: Deep learning
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

Lippenlesen, auch visuelle Spracherkennung genannt, ist eine der herausfordendesten Aufgabe in der Kreuzung zwischen Computervision und Verarbeitung der natürlichen Sprachen. Fast alle Arbeiten in diesem Bereich konzentrieren sich auf die englische Sprache. Diese Abschlussarbeit untersucht, implementiert und evaluiert verschiedene neuronale Netze für die deutsche Sprache. Dafür wird der Datensatz DLIP erschaffen.

Kurzfassung auf Englisch:

Lip Reading, also known as Visual Speech Recognition is a challenging task in the intersection between Computer Vision and Natural Language Processing. Most works in this field focus on the English language. This thesis analyses, implements and evaluates different neural networks on the German language. DLIP is created and served as the dataset.

Hinweis zum Urheberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.