GPT-Realtime-2 is sinds 7 mei 2026 beschikbaar in de API van OpenAI voor ontwikkelaars die spraakagents bouwen. Het nieuwe spraakmodel brengt GPT-5-klasse redeneren naar realtime gesprekken, met de nadruk op luisteren, redeneren en complexe problemen oplossen terwijl een gesprek loopt. De aankondiging noemt de API als distributiekanaal, niet ChatGPT Free, Plus, Pro of Enterprise. Voor ontwikkelaars betekent dit dat de release vooral relevant is voor toepassingen via platform.openai.com.
Introducing GPT-Realtime-2 in the API: our most intelligent voice model yet, bringing GPT-5-class reasoning to voice agents.
Voice agents are now real-time collaborators that can listen, reason, and solve complex problems as conversations unfold.
Now available in the APIā¦
ā OpenAI (@OpenAI) May 7, 2026
GPT-Realtime-2 richt zich op spraakagents
GPT-Realtime-2 is een modelrelease voor realtime spraak, niet alleen een tekstmodel met later toegevoegde audio. De kern van de aankondiging is dat voice agents direct kunnen luisteren en reageren tijdens een lopend gesprek. Dat is belangrijk voor ontwikkelaars van klantenservice, training en interne helpdesks, omdat een spraakagent daar minder bruikbaar is als hij pas na lange pauzes kan redeneren.
OpenAI koppelt GPT-Realtime-2 expliciet aan GPT-5-klasse redeneren. Daarmee positioneert het bedrijf het model boven eerdere realtime spraaktoepassingen die vooral gericht waren op snelle conversatie. De aankondiging bevat geen cijfers over vertraging, contextvenster, talen of audioformaten. Daardoor is nog niet vast te stellen hoe groot de technische stap is ten opzichte van eerdere realtime API-modellen van OpenAI.
API-release sluit ChatGPT-gebruikers uit
De beschikbaarheid loopt via de API, de programmeerbare ingang waarmee ontwikkelaars functies van OpenAI in eigen software aanroepen. Dat maakt GPT-Realtime-2 direct relevant voor bedrijven die zelf een voice agent bouwen of beheren. De aankondiging noemt geen uitrol naar de ChatGPT-app, geen abonnementen zoals Plus of Pro en geen aparte toegang voor Team, Enterprise of EDU.
Voor consumenten is het verschil concreet: deze release betekent niet automatisch dat ChatGPT op een telefoon of laptop nieuwe spraakfuncties krijgt. Voor ontwikkelaars betekent de API-route juist dat zij het model kunnen koppelen aan bestaande systemen, zoals callcentersoftware of interne kennisbanken. OpenAI noemt in de aankondiging geen prijs per miljoen tokens en ook geen aparte tarieven voor audio-invoer of audio-uitvoer.
Realtime redeneren verandert de workflow
OpenAI beschrijft voice agents met GPT-Realtime-2 als realtime samenwerkers die problemen kunnen oplossen terwijl het gesprek zich ontwikkelt. Dat wijst op een andere rol dan een simpele spraakbot die alleen vaste antwoorden geeft. In een enterprise-omgeving kan zo’n agent bijvoorbeeld tijdens ƩƩn gesprek informatie ophalen, een probleem analyseren en vervolgstappen voorstellen, zolang de ontwikkelaar die acties via de API heeft ingericht.
De term GPT-5-klasse redeneren is relevant, maar de aankondiging geeft geen benchmarkresultaten. Er zijn geen scores genoemd voor gangbare tests zoals MMLU, GPQA, AIME of SWE-bench. Ook ontbreekt een system card of veiligheidsrapport in de aankondiging zelf. Voor zakelijke kopers zijn juist die gegevens nodig om GPT-Realtime-2 te vergelijken met eerdere OpenAI-modellen en met eigen kwaliteitsmetingen.
OpenAI laat cruciale details open
De aankondiging noemt geen regio’s, talen of beperkingen voor GPT-Realtime-2. Daardoor is niet duidelijk of de API-release wereldwijd gelijk is, of dat bepaalde markten later toegang krijgen. Voor Nederlandse ontwikkelaars is vooral taalondersteuning van belang, omdat spraakherkenning en natuurlijke uitspraak per taal sterk kunnen verschillen. OpenAI gaf in dit bericht geen aparte informatie over Nederlands of Europese beschikbaarheid.
Ook over veiligheid en misbruikpreventie zijn in de aankondiging geen details gedeeld. Dat is relevant omdat realtime stemmodellen gevoeliger zijn voor fouten in live gesprekken dan tekstmodellen die eerst gecontroleerd kunnen worden. De eerstvolgende harde toets voor GPT-Realtime-2 zit daarom niet in de naam van het model, maar in documentatie over prijzen, latency, veiligheidsfilters en ondersteunde talen op het officiƫle ontwikkelaarsplatform.
