Live Subtitling for BigBlueButton with Open-Source Software

; ; ;

URL
Dokumentart: InProceedings (Aufsatz / Paper einer Konferenz etc.)
Institut: Fachbereich Informatik
Sprache: Englisch
Erstellungsjahr: 2021
Publikationsdatum:
Originalveröffentlichung: Proceedings of Interspeech (Show & Tell Session) 2021, Brno, Czechia (2021)
Freie Schlagwörter (Deutsch): automatische Spracherkennung , Videokonferenz , computerunterstützte Zusammenarbeit , automatische Untertitelung , Mehrpersonendialog , VoIP
Freie Schlagwörter (Englisch): ASR , videoconferencing , meeting transcription , computer-supported collaborative work , automatic subtitles , multi-party dialogue , VoIP
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.75 , 53.76

Kurzfassung auf Englisch:

We present an open source plugin for live subtitling in the popular open source video conferencing software BigBlueButton. Our plugin decodes each speaker’s audio stream separately and in parallel, thereby obliviating the need for speaker diarization and seamlessly handling overlapped talk. Any Kaldi-compatible nnet3 model can be used with our plugin and we demonstrate it using freely available TDNN-HMM-based ASR models for English and German. Our subtitles can be used as they are (e.g., in loud environments) or can form the basis for further NLP processes. Our tool can also simplify the collection of remotely recorded multi-party dialogue corpora.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.