1.2.4 Caption (Live)

WCAG-Definition

Live-Audio-Inhalte, die in synchronisierten Medien (z. B. Livestreams) verwendet werden, müssen mit Untertiteln versehen werden.

Was ist gemeint?

Wenn du Live-Videos mit Ton auf deiner Website anbietest (z. B. Veranstaltungen, Nachrichten, Schulungen), dann müssen die gesprochenen Inhalte in Echtzeit untertitelt werden.

Diese Live-Untertitel sollen:

  • Synchron zum gesprochenen Wort erscheinen
  • Gesprochenen Inhalt vollständig wiedergeben
  • Möglichst Geräusche und Sprecherkennzeichnung enthalten

Ausreichende Techniken

Bereitstellung synchronisierte Untertitel für Live-Audio-Inhalte

YouTube Livestream mit Live-Untertiteln:

  • Aktiviere in YouTube Studio automatische Live-Captions (cc)
  • Oder arbeite mit einem Live-Captioning-Dienst, z. B.:
    • Google Live Caption (automatisch)
    • Otter.ai
    • VerbaVoice, Ai-Live (professionell, DE)

<iframe
width="560" height="315"
src="https://www.youtube.com/embed/live_stream?channel=DEINE_ID&cc_load_policy=1"
title="Live-Event mit Untertiteln"
allowfullscreen></iframe>

Eigener HTML5-Player mit WebSocket oder Live-Untertitelung

Möglichkeit: Ein HTML5 <video>-Stream + paralleler Textstream (z. B. per WebSocket, Web Speech API)

<video id="liveVideo" controls autoplay></video>
<div id="liveCaptions" aria-live="assertive" aria-atomic="true"></div>
<script>
// Beispielhafter WebSocket-Live-Text-Stream
const socket = new WebSocket("wss://dein-server.de/live-captions");
socket.onmessage = (event) => {
document.getElementById("liveCaptions").textContent = event.data;
};
</script>
  • aria-live="assertive" sorgt dafür, dass Screenreader neuen Text sofort ausgeben.
  • Du brauchst dafür entweder:
    • Automatisierte Spracherkennung
    • Oder menschliche Live-Schriftübersetzer (Stenotypisten), die den Text einspeisen

Beratungstechniken

  • Untertitel sollten Geräusche und Stimmungen beschreiben (z. B. [Applaus], [Lachen])
  • Bei multilingualen Streams verschiedene Untertitelsprachen anbieten
  • Nutzern ermöglichen, Schriftgröße und Kontrast der UT anzupassen
  • Verlinkung auf Live-Textprotokoll (Live Transcript) zusätzlich zum Video
  • UT sind visuell synchron zur Sprache (nicht verzögert)

Fehler

  • Live-Video wird ohne irgendeine Form von Untertiteln ausgestrahlt
  • UT sind stark verzögert oder nicht synchron mit dem Ton
  • UT fehlen für wesentliche akustische Inhalte wie z. B. Q&A, Musiktexte, Lacher