Sprachkommunikation mit einem Service-Roboter

URL
Dokumentart: Bachelor Thesis
Institut: Department Informatik
Sprache: Deutsch
Erstellungsjahr: 2011
Publikationsdatum:
SWD-Schlagwörter: Automatische Spracherkennung
DDC-Sachgruppe: Informatik

Kurzfassung auf Deutsch:

Bei dieser Arbeit handelt es sich um die Entwicklung eines Sprachinterfaces für den mobilen Roboter SCITOS G5 an der Hochschule für Angewandte Wissenschaften Hamburg. Ziel ist es so eine Sprachkommunikation mit einem Service-Roboter herzustellen und diesem Aufgaben zu erteilen. Dabei spielt die Spracheingabe sowie auch die Sprachausgabe eine große Rolle. Es werden drei verschiedene Verfahren zur Spracherkennung vorgestellt, wobei die Erkennung mittels Hidden Markov Modell implementiert wird. Das System baut auf der kontinuierlichen Spracherkennungs-Engine Julius auf. Zur Modellierung wird Simon eingesetzt, da es eine komfortable grafische Oberfläche hat, und das trainieren von Wörtern sehr leicht macht. Zur Steuerung und Dialogführung wird ein Zustandsautomat eingesetzt, der leicht verändert und erweitert werden kann. Die Sprachsynthese erfolgt über das Open Source Tool Mbrola und wird auch über den Zustandsautomaten gesteuert. Zum Projektende wurde an dem Beispieldialog KIARA eine Erkennungsrate von 95,91% erreicht.

Kurzfassung auf Englisch:

This thesis introduces the development of a speech interface for the service robot SCITOS G5 at Hochschule für Angewandte Wissenschaften Hamburg. The aim is to establish a voice communication with a service robot where speech recognition and speech synthesis play the major role. There are three methods for speech recognition presented, where Hidden Markov Modell is implemented finally. The system is based on the continuous speech recognition engine Julius. Simon is used for modeling because it has a comfortable graphical user interface, and the training of words is very easy. To control the machine a stateMachine is used, which can be easily edited and expanded. The speech synthesis is performed by the Open-Source tool Mbrola which is also controlled by the state machine. At the end of the demo project KIARA a speech recognition rate of 95,91% was achieved.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.