1.2.4 Caption (Live)
WCAG-Definition
Live-Audio-Inhalte, die in synchronisierten Medien (z. B. Livestreams) verwendet werden, müssen mit Untertiteln versehen werden.
Was ist gemeint?
Wenn du Live-Videos mit Ton auf deiner Website anbietest (z. B. Veranstaltungen, Nachrichten, Schulungen), dann müssen die gesprochenen Inhalte in Echtzeit untertitelt werden.
Diese Live-Untertitel sollen:
- Synchron zum gesprochenen Wort erscheinen
- Gesprochenen Inhalt vollständig wiedergeben
- Möglichst Geräusche und Sprecherkennzeichnung enthalten
Ausreichende Techniken
Bereitstellung synchronisierte Untertitel für Live-Audio-Inhalte
YouTube Livestream mit Live-Untertiteln:
- Aktiviere in YouTube Studio automatische Live-Captions (cc)
- Oder arbeite mit einem Live-Captioning-Dienst, z. B.:
- Google Live Caption (automatisch)
- Otter.ai
- VerbaVoice, Ai-Live (professionell, DE)
<iframe
width="560" height="315"
src="https://www.youtube.com/embed/live_stream?channel=DEINE_ID&cc_load_policy=1"
title="Live-Event mit Untertiteln"
allowfullscreen></iframe>
Eigener HTML5-Player mit WebSocket oder Live-Untertitelung
Möglichkeit: Ein HTML5 <video>-Stream + paralleler Textstream (z. B. per WebSocket, Web Speech API)
<video id="liveVideo" controls autoplay></video>
<div id="liveCaptions" aria-live="assertive" aria-atomic="true"></div>
<script>
// Beispielhafter WebSocket-Live-Text-Stream
const socket = new WebSocket("wss://dein-server.de/live-captions");
socket.onmessage = (event) => {
document.getElementById("liveCaptions").textContent = event.data;
};
</script>
- aria-live="assertive" sorgt dafür, dass Screenreader neuen Text sofort ausgeben.
- Du brauchst dafür entweder:
- Automatisierte Spracherkennung
- Oder menschliche Live-Schriftübersetzer (Stenotypisten), die den Text einspeisen
Beratungstechniken
- Untertitel sollten Geräusche und Stimmungen beschreiben (z. B. [Applaus], [Lachen])
- Bei multilingualen Streams verschiedene Untertitelsprachen anbieten
- Nutzern ermöglichen, Schriftgröße und Kontrast der UT anzupassen
- Verlinkung auf Live-Textprotokoll (Live Transcript) zusätzlich zum Video
- UT sind visuell synchron zur Sprache (nicht verzögert)
Fehler
- Live-Video wird ohne irgendeine Form von Untertiteln ausgestrahlt
- UT sind stark verzögert oder nicht synchron mit dem Ton
- UT fehlen für wesentliche akustische Inhalte wie z. B. Q&A, Musiktexte, Lacher