Navigating the Spoken Wikipedia

;

URN urn:nbn:de:gbv:18-228-7-2290
URL
Dokumentart: Aufsatz
Institut: Fachbereich Informatik
Sprache: Englisch
Erstellungsjahr: 2016
Publikationsdatum:
Freie Schlagwörter (Deutsch): Barrierefreiheit , auditive Interaktion , Sprechschnittstelle , Wikipedia , Hypermedia
Freie Schlagwörter (Englisch): accessibility , eyes-free interaction , voice user interface , Wikipedia , hyperlistening
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.75

Kurzfassung auf Englisch:

The Spoken Wikipedia project unites volunteer readers of encyclopedic entries. Their recordings make encyclopedic knowledge accessible to persons who are unable to read (out of alexia, visual impairment, or because their sight is currently occupied, e. g. while driving). However, on Wikipedia, recordings are available as raw audio files that can only be consumed linearly, without the possibility for targeted navigation or search. We present a reading application which uses an alignment between the recording, text and article structure and which allows to navigate spoken articles, through a graphical or voice-based user interface (or a combination thereof). We present the results of a usability study in which we compare the two interaction modalities. We find that both types of interaction enable users to navigate articles and to find specific information much more quickly compared to a sequential presentation of the full article. In particular when the VUI is not restricted by speech recognition and understanding issues, this interface is on par with the graphical interface and thus a real option for browsing the Wikipedia without the need for vision or reading.

Kurzfassung auf Deutsch:

Im Projekt gesprochene Wikipedia werden Leser vereint die auf freiwilliger Basis Enzyklopädie-Artikel vorlesen. Die dabei entstehenden Aufnahmen machen das Wissen der Enzyklopädie für Leser, die nicht in der Lage sind zu lesen (z.B. Aufgrund von Alexie, Sehbeeinträchtigungen oder einfach weil sich ihre Augen gerade mit anderen Dingen -z.B. Autofahren- beschäftigt sind) verfügbar. Auf Wikipedia sind die Aufnahmen als RAW Audio verfügbar, welches lediglich linear konsumiert werden kann. Eine Möglichkeit zur gezielten Navigation oder zur Suche ist nicht vorhanden. Wir stellen eine Anwendung vor, welche ein Alignment, das zwischen Aufnahme, Text und Artikelstruktur Zusammenhänge beschreibt, nutzt. Dieses Alignment erlaubt es in gesprochenen Artikeln mit Hilfe von grafisch- und sprachbasierten Benutzerschnittstellen (oder Kombinationen aus beiden) zu navigieren. Zudem stellen wir die Ergebnisse einer Nutzerstudie vor, welche die beiden Nutzungsmodalitäten miteinander vergleicht. Wir finden, dass beide Interaktionsarten es dem Nutzer erlauben in gesprochenen Artikeln zu navigieren und im Vergleich zum linearen Zuhören deutlich schneller spezifische Informationen zu finden. Insbesondere dann, wenn die sprachbasierte Benutzerschnittstelle (Voice-User-Interface) nicht durch Probleme mit der Erkennung und Interpretation von Sprachbefehlen eingeschränkt wird, ist sie gleichauf mit der grafischen Benutzerschnittstelle und somit eine echte Alternative um die Wikipedia ohne Notwenigkeit des visuellen Kanals konsumieren zu können.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.