Meertalige AI-ondertitels toevoegen aan cursusvideos
Ondertitels toevoegen betekende vroeger transcribenten inhuren ($1–3/min) en vertalers ($0,10–0,20/woord per taal). Een 10-uur cursus vertaald naar vijf talen was een vier-cijferige factuur en twee weken wachten.
In 2026 ziet de pijplijn er anders uit. AI doet transcriptie, vertaling en timing — mensen reviewen in plaats van vanaf nul te schrijven. Kosten per taal zakken met factor 50–100. Bij technisch cursusmateriaal is de kwaliteit goed genoeg dat studenten het niet merken.
Dit is het praktische playbook.
Waarom meertalige ondertitels?
Twee redenen die omzet bewegen:
- Toegankelijkheid uitbreiden. Slechthorende kijkers, lawaaierige omgevingen, tweedetaal-leerders — captions verbreden je publiek zelfs in één taal.
- Internationale markt. Engels-only cursussen laten enorme markten liggen. Spaans + Duits + Frans + Portugees + Japans toevoegen kan je globale audience grofweg verdubbelen zonder een les opnieuw op te nemen.
Bij high-ticket cursussen ($500+) betaalt zelfs een lift van 5–10% uit internationale verkoop de hele pijplijn meermaals terug.
Pijplijn op een rij
[Bronvideo]
│
▼
[Transcriberen naar bron-VTT] ← Whisper-klasse STT
│
▼
[Handmatige bron-VTT-review] ← 5–10 min per uur video
│
▼
[AI vertaalt naar doeltalen] ← Claude / Gemini
│
▼
[Optionele native-reviewer-pass] ← voor premium tiers
│
▼
[Bevestigen als <track> in HLS-player] ← WebVTT-sidecars
Elke stap heeft kwaliteitsknoppen. Sla menselijke review over bij goedkope content; voeg native reviewer toe bij high-stakes materiaal.
Stap 1: Brontaal transcriberen
Moderne speech-to-text-modellen (Whisper large-v3, Gemini audio-mode, Claude audio-understanding) produceren getimede VTT direct uit bron-audio.
Wat te voeren:
- Bron-audio op de hoogst beschikbare bitrate. Niet downsamplen voor transcriptie. Een MP4 met originele audio voldoet.
- Brontaal-hint. Auto-detect werkt, maar taal opgeven verlaagt fouten op de eerste burst.
- Speaker-hints (optioneel). Bij meerdere sprekers labelen; sommige modellen diarizeren.
Output: WebVTT-timestamps + tekst. Verwacht 95 %+ woordnauwkeurigheid bij heldere narratie; eigennamen, technische jargon en merknamen handmatig fixen.
Stap 2: Bron-VTT opschonen (niet overslaan)
De goedkoopste, meest hefboomrijke stap. Vijf minuten menselijke review op het bron-VTT voorkomt 50 minuten cleanup over de vertalingen.
Wat te fixen:
- Merknamen (jouw product, integraties, frameworks).
- Domein-jargon dat het model fonetisch hallucineerde.
- Zinsgrenzen — AI-cues breken soms midden in een bijzin; aanscherpen voor leesbaarheid.
- Speaker-labels indien relevant.
Voer het opgeschoonde bron-VTT in vertaling. Garbage in, garbage out — bij vertaling dubbel.
Stap 3: AI-vertaling naar doeltalen
Frontier-LLMs (Claude, Gemini) handelen vertaling af in één prompt: “Vertaal dit VTT-bestand naar {doeltaal}, behoud timestamps, behoud cue-nummering, verander geen < of >-tags.”
Twee tips:
- Vertaal het hele bestand in één prompt als het in het context-window past. Cross-cue-context geeft consistentere terminologie.
- Geef een glossary mee. Een korte lijst zoals
{"AVCaption": "AVCaption", "embed token": "embed token (technisch), insluittoken (UX)"}houdt merknamen en vakjargon consistent.
Bij technisch cursusmateriaal is de kwaliteit nu zodanig dat de meeste studenten het verschil met menselijke vertaling niet merken. Voor marketing of humor: reviewer inhuren.
Stap 4: Bevestigen als WebVTT-tracks
In HLS worden ondertitel-tracks gerefereerd vanuit de master-playlist:
#EXT-X-MEDIA:TYPE=SUBTITLES,GROUP-ID="subs",NAME="English",
DEFAULT=YES,LANGUAGE="en",URI="subs/en.m3u8"
#EXT-X-MEDIA:TYPE=SUBTITLES,GROUP-ID="subs",NAME="Nederlands",
DEFAULT=NO,LANGUAGE="nl",URI="subs/nl.m3u8"
Elke subs/{lang}.m3u8 is een mini-playlist die naar het WebVTT-bestand wijst. De player toont ze in het captions-menu.
Als je host het abstraheert (zoals AVCaption), upload je de VTT en bedraadt het platform de playlist.
Stap 5: (Optioneel) Inbranden voor één taal
Sommige platforms (TikTok, Instagram Reels, LinkedIn) spelen autoplay gedempt; ingebrande captions in één taal verhogen completion. Op je cursusplatform is sidecar VTT altijd beter — wisselbaar, taalflexibel, geen storage-bloat.
Branden voor social? Genereer een apart bestand. Meng inbranding en sidecar niet in dezelfde aflevering.
Kwaliteitschecks die werken
- Lengte-check. Elke cue moet leesbaar zijn in zijn tijdslot. Vertaalde tekst is vaak 20–40 % langer (Duits, Spaans). Aanscherpen of splitsen.
- Verboden tekens. Sommige scripts (Arabisch, Hebreeuws) zijn RTL — verifieer player-rendering.
- Consistentie. Merknamen en kerntermen moeten identiek door het bestand verschijnen. Een grep vindt drift.
- Timing-drift. Lange video’s stapelen kleine timingfouten. Steekproeven bij 25 %, 50 %, 75 %.
Eerlijke kosten
Ruwe API-kosten voor 10-minuten video in 5 talen:
- Transcriptie: ~$0,05–0,10
- Vertaling (5 talen): ~$0,10–0,30
- Totaal: ruim onder $1
Voeg menselijke review toe en kosten stijgen met reviewer-tarief. Native reviewer aan $30/uur, 10 min/taal: +$25 totaal.
Gebundelde ondertitel-features in videoplatforms rekenen vaak per minuut of per taal, typisch $0,10–0,50/min/taal. AVCaption Enterprise neemt meertalige ondertitels op in de vaste prijs — handig bij grote bibliotheken.
Hoe AVCaption de pijplijn afhandelt
AVCaption Studio (Enterprise) rijdt de authoring-kant end-to-end:
- Upload video → Studio auto-detecteert de brontaal en produceert een concept-transcript uit de audio.
- Bewerk cues in de Studio-editor (bronregel + waveform + frame-thumbnail naast elkaar) — fix merknamen, scherp zinsgrenzen aan.
- Voeg extra taaltracks toe (vertaalde
.vtt-bestanden) — kosten gebundeld in het Enterprise-tier. - WebVTT-tracks worden automatisch aan de HLS-playlist gehangen; de custom embed player toont ze in het CC-menu.
De player zelf draagt onbeperkt tracks per video op elke tier (Free included) en rendert tweetalige (twee-talen) weergave als je ?subtitle2={lang} meegeeft in de embed-URL — handig voor taalleerders en internationale teams die in hun tweede taal reviewen.
Talen die de moeite waard zijn
Als je er maar een handvol kunt kiezen, een impactvolle starterset voor Engelse-bron cursussen:
- Spaans — enorme markt LatAm + Spanje.
- Portugees (BR) — groot, ondergeleverd door Engels-only cursussen.
- Duits — hoge koopkracht, betaalt vaak voltarief.
- Frans — Frankrijk + Canada + delen van Afrika.
- Japans — premium tech-creator-markt, lage Engelse cursuspenetratie.
- Vietnamees, Indonesisch, Thai — snelgroeiende creator-economieën, weinig concurrentie.
Talen waar je onderwerp geen zoekvolume heeft, overslaan. Vertaal kookcontent niet naar Latijn.
Samenvatting
AI-ondertitels in 2026 zijn niet “experimenteel”. Het is de standaard voor kostenbewuste creators die globaal gaan. Rij de goedkope pijplijn (audio STT → vertaling → VTT), doe een 5-minuten human pass, ship — en laat de player de multi-track switching live afhandelen.
De AVCaption-player draagt onbeperkt ondertiteltracks per video op elke tier (Free included), plus tweetalige weergave voor leerders — upload je bronvideo en één VTT-track, voeg ?subtitle=es&subtitle2=en toe aan de embed-URL en zie tweetalige modus live. Studio (Enterprise) helpt met transcript-creatie als je geen bronbestanden hebt. Meer over internationale cursusstrategie: online cursussen en digitale producten.