Entwicklung und Realisierung eines Systems für die automatische Spracherkennung mit einem erweiterten TI DSP Modul zur Robotersteuerung

Development and implementation of a system for automatic speech recognition with an extended TI DSP module to navigate a robot

URL
Dokumentart: Diplomarbeit, Magisterarbeit, Master Thesis
Institut: Department Informations- und Elektrotechnik
Sonstige beteiligte Institution: Fachhochschule Westküste, Fachbereich Technik
Sprache: Deutsch
Erstellungsjahr: 2010
Publikationsdatum:
SWD-Schlagwörter: Automatische Spracherkennung , Roboter
DDC-Sachgruppe: Ingenieurwissenschaften und Maschinenbau

Kurzfassung auf Deutsch:

Entwickelt wird eine Spracherkennung zur Steuerung selbst fahrender Roboter. Hierzu wird ein vollständiges Simulationsmodell in Matlab® programmiert, welches sowohl das Anlegen einer Referenzdatenbank als auch die Spracherkennung umfasst. Dabei wird eine Einzelworterkennung mit kleinem Wortschatz realisiert; Wortund Sprecheranzahl können erweitert werden. Die Spracherkennung arbeitet blockbasiert, wobei die einzelnen Blöcke überlappend angeordnet werden. Zur Vorverarbeitung wird ein FIR-Bandpassfilter eingesetzt. Eine Isolierung des Wortes erfolgt mit Hilfe der logarithmierten quadratischen Energie der einzelnen Blöcke durch eine aufwendige Wortgrenzenerkennung. Zur Identifikation werden die Merkmale eines jeden Blockes eines Wortes durch LPC-Koeffizienten, die mit dem Levinson-Durbin-Algorithmus berechnet werden, dargestellt. Für den Mustervergleich wird DTW mit einer lokalen Pfadeinschränkung und mehreren Bewertungskriterien eingesetzt. Abschließend wird die Spracherkennung auf einem DSP, der über eine selbst entwickelte Kommunikationsplatine zwei bestimmte Roboter ansteuern kann, implementiert.

Kurzfassung auf Englisch:

A system for automatic speech recognition is being developed to navigate a selfdriving robot. Therefore a complete simulation model is being programmed in Matlab®, which includes the management of the reference database as well as the speech recognition. The isolated word recognition is being realized with a small word pool although the amount of words and speakers can be extended. The speech recognition system works block-based in which the blocks are sorted overlappingly. A FIR bandgap filter is being used during the preprocessing.The isolation of a word is achieved with a complex endpoint detection, using the logarithmical quadratic energy of the individual blocks. To identify the word, the characteristics of each block of each word is being represented by LPC parameters, calculated with the Durbin’s method. For the pattern comparison the DTW is being used with a local path restriction and several evaluation criterias. After that, the speech recognition is being implemented on a DSP, which can direct two distinct robots with an especially developed communication board.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.