Partial Representations Improve the Prosody of Incremental Speech Synthesis
URN | urn:nbn:de:gbv:18-228-7-2196 |
---|---|
URL | http://edoc.sub.uni-hamburg.de/informatik/volltexte/2016/219/ |
Dokumentart: | InProceedings (Aufsatz / Paper einer Konferenz etc.) |
Institut: | Fachbereich Informatik |
Sonstige beteiligte Institution: | Presented at Interspeech 2014 (September, Singapore) |
Sprache: | Englisch |
Erstellungsjahr: | 2014 |
Publikationsdatum: | 21.04.2016 |
Freie Schlagwörter (Deutsch): | inkrementelle Verarbeitung , Prosody , Sprachsynthese , Dialogsysteme , Simultandolmetschen |
Freie Schlagwörter (Englisch): | incremental processing , prosody , speech synthesis , spoken dialogue systems , simultaneou interpreting |
DDC-Sachgruppe: | Informatik |
BK - Klassifikation: | 54.75 |
Kurzfassung auf Englisch:
When humans speak, they do not plan their full utterance in all detail before beginning to speak, nor do they speak piece-by-piece and ignoring their full message – instead humans use partial representations in which they fill in the missing parts as the utterance unfolds. Incremental speech synthesizers, in contrast, have not yet made use of partial representations and the information contained there-in. We analyze the quality of prosodic parameter assignments (pitch and duration) generated from partial utterance specifications (substituting defaults for missing features) in order to determine the requirements that symbolic incremental prosody modelling should meet. We find that broader, higher-level information helps to improve prosody even if lower-level information about the near future is yet unavailable. Furthermore, we find that symbolic phrase-level or utterance-level information is most helpful towards the end of the phrase or utterance, respectively, that is, when this information is becoming available even in the incremental case. Thus, the negative impact of incremental processing can be minimized by using partial representations that are filled in incrementally.
Hinweis zum Urherberrecht
Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.