Using DIA-MOLE for unsupervised learning of domain-specific dialogue acts from spontaneous language

URL
Dokumentart: Report (Bericht)
Schriftenreihe: Berichte des Fachbereichs Informatik der Universität Hamburg
Bandnummer: 191
Sprache: Englisch
Erstellungsjahr: 1991
Publikationsdatum:
SWD-Schlagwörter: Mensch-Maschine-Kommunikation , Mensch-Maschine-Schnittstelle , Sprachverarbeitung
Freie Schlagwörter (Deutsch): sprachverarbeitung
Freie Schlagwörter (Englisch): human computer interaction , human computer communication , spoken language system
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.08 , 54.75

Kurzfassung auf Englisch:

This report introduces DIA-MOLE, a tool that supports an engineering-oriented approachtowards dialogue modelling for a spoken-language interface. Our approach is applied to the domain of appointment scheduling. A major step towards dialogue models is to know about the basic units that areused to construct a dialogue model. DIA-MOLE does not employ theory-based dialogue units because theyare subject to human interpretation and often cannot be recognized from data available in a spoken-language system. We pursue a data-driven approach and apply unsupervised learning to a sample set of spontaneous dialogues using multiple knowledge sources, i.e. domain and task knowledge, word recognition and prosodic information. Using these data, DIA-MOLE supports segmentation of turns and interpretation of their illocutionary force based on a model of the task. For this purpose we had to develop a model of interactive problem solving in the domain of appointment scheduling. As a result of learning we obtain domain- and task-specific dialogue acts (DDA). A first validation of the set of learned DDAs shows that they are prominent for this domain and task. SomeDDAs show significant correspondence to specific nodes in an RST-structure. Automatic DDA labeling was compared with human dialogue act labeling according to a predefined labeling scheme. Dialogue actprediction was also employed to evaluate our approach.

Kurzfassung auf Deutsch:

Das Werkzeug DiaMoLE unterstützt einen ingenieursmässigen Ansatz zur Dialog-modellierung für eine gesprochen-sprachliche Mensch-Maschine-Schnittstelle. Der vorgestellte Ansatz findet Anwendung in der Domäne Terminvereinbarung. Ein bedeutender Schritt auf dem Weg zu einem Dialog-Modell ist die Kenntnis der zugrundeliegenden Einheiten, aus denen es sich zusammensetzt. In Dia-MoLE finden keine theoriebasierten Dialogeinheiten Anwendung, die menschliche Interpretation voraussetzen und die auf der Basis vorhandener Daten in einem gesprochen-sprachlichen System nur eingeschränkt erkannt werden können. Unter Verwendung verschiedener Wissensquellen, wie Domänen- und Aufgabenwissen, Worterkennung und Prosodie wird anstattdessen ein datengetriebener Ansatz verfolgt. Ausgehend von diesen Daten wird in Dia-MoLE die Segmentierung von Äusserungen und die Interpretation der Illokution basierend auf einem Modell der Aufgabe vorgenommen. Hierzu musste für die Domäne Terminvereinbarung ein Modell interaktiver Problemlösung entwickelt werden. Anschliessend wird ein unüberwachtes Lernverfahren auf eine Reihe derartig vorverarbeiteter spontansprachlicher Dialoge angewendet. Als Ergebnis des Lernverfahrens werden domänen- und aufgabenspezifische Dialogakte (DDA) gebildet. Weitere Dialogbeiträge können aufgrund der DDA klassifiziert werden. Erste Analysen bestätigen, dass die Menge der gelernten DDAs charakteristisch für die Domäne und Aufgabe sind. So zeigen einige DDAs signifikante Übereinstimmung mit bestimmten Knoten in einer RST-Struktur. Automatisches Labeling mit DDA wird verglichen mit human-gelabelten Dialogakten. Darüberhinaus wurde eine Dialogaktvorhersage implementiert, um die Qualität der Ergebnisse dieses Ansatzes auch in dieser Hinsicht zu evaluieren.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.