Het Chinese AI-lab DeepSeek heeft vrijdag twee nieuwe open-source taalmodellen uitgebracht, DeepSeek-V4-Pro en DeepSeek-V4-Flash, die elk een contextvenster van ƩƩn miljoen tokens ondersteunen. De modellen zijn direct beschikbaar via de DeepSeek-chatomgeving, de API en als open weights op Hugging Face.
Met de V4-reeks mikt DeepSeek op een prijspunt dat fors onder dat van westerse concurrenten ligt, terwijl de prestaties volgens het bedrijf in de buurt komen van gesloten topmodellen. Het is de eerste grote release van DeepSeek sinds V3.2 in december 2025, en komt in een markt waarin Chinese labs elkaar in hoog tempo inhalen.
š DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.
— DeepSeek (@deepseek_ai) April 24, 2026
š¹ DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
š¹ DeepSeek-V4-Flash: 284B total / 13B active params.⦠pic.twitter.com/n1AgwMIymu
Twee modellen, ƩƩn contextvenster
DeepSeek-V4-Pro is het vlaggenschip, met 1,6 biljoen totale parameters en 49 miljard actieve parameters in een Mixture-of-Experts-opzet. Het model is voorgetraind op 33 biljoen tokens. De lichtere V4-Flash telt 284 miljard parameters in totaal, 13 miljard actief, en is getraind op 32 biljoen tokens. Beide modellen ondersteunen denk- en directe modus, functie-aanroepen en JSON-uitvoer.
De uitbreiding naar een miljoen tokens context, ongeveer 750.000 woorden, is technisch mogelijk gemaakt door een nieuwe aandachtsarchitectuur die DeepSeek Sparse Attention noemt, gecombineerd met token-wise compressie. In het technische rapport stelt DeepSeek dat V4-Pro bij een contextvenster van een miljoen tokens nog slechts 27 procent van de rekenkracht en 10 procent van het geheugen nodig heeft vergeleken met voorganger V3.2.
Prijs als wapen
De API-prijzen zijn het scherpste signaal dat DeepSeek afgeeft. V4-Flash kost 0,028 dollar per miljoen invoer-tokens bij een cache-hit en 0,28 dollar per miljoen uitvoer-tokens. Voor V4-Pro liggen die prijzen op 0,145 dollar en 3,48 dollar. Ter vergelijking: OpenAI rekent voor GPT-5.4 2,50 dollar per miljoen invoer-tokens en 15 dollar per miljoen uitvoer-tokens, terwijl Anthropic voor Claude Opus 4.6 respectievelijk 5 en 25 dollar vraagt. Dat is een prijsverschil dat oploopt tot ongeveer 80 procent.
“DeepSeek-V4 is seamlessly integrated with leading AI agents like Claude Code, OpenClaw & OpenCode”, aldus het bedrijf in een verklaring op X. De modellen zouden ook al intern worden gebruikt voor het coderingswerk van DeepSeek zelf.
Open-source markt raakt voller
De release verschijnt op een moment dat Chinese labs de open-source markt domineren. V4-Pro is met 865 gigabyte aan weights naar verluidt het grootste open-weights model tot nu toe, groter dan Kimi K2.6 van Moonshot AI (1,1 biljoen parameters) en GLM-5.1 van Zhipu AI (754 miljard parameters). Qwen van Alibaba heeft de afgelopen maanden op verschillende benchmarks boven DeepSeek gepresteerd, wat analisten zien als een van de drijfveren achter deze release.
In het Westen blijven OpenAI, Anthropic en Google met gesloten modellen de top bezetten. Meta heeft zijn Llama-reeks enkele maanden geleden stilgelegd, waardoor het zwaartepunt van de open-source-AI grotendeels naar Chinese labs is verschoven.
Wat DeepSeek niet laat zien
De benchmarks die DeepSeek bij de release publiceert zijn zelfgerapporteerd en nog niet door onafhankelijke partijen gereproduceerd. Het bedrijf geeft wel zelf toe dat V4-Pro achterloopt op Google’s Gemini-3.1-Pro als het om algemene wereldkennis gaat, en op OpenAI’s GPT-5.4 bij een aantal agentic taken. Ook ontbreekt een volledige lijst van de trainingsdata.
De “Preview”-status in de naam suggereert dat dit niet de finale V4-versie is. Een releasedatum voor de definitieve modellen heeft DeepSeek niet genoemd. Wel is bekend dat de oudere modellen deepseek-chat en deepseek-reasoner op 24 juli 2026 worden uitgefaseerd.

