Een nieuw AI-model met de naam Mythos zorgt deze week voor onrust op sociale media en in techkringen. De makers noemen het model āsupersterkā en beter dan bestaande systemen. Nederlandse experts vragen om bewijs en heldere uitleg. Dit debat raakt ook Europa, omdat de Europese AI-verordening gevolgen heeft voor overheid en bedrijven die zulke modellen willen gebruiken.
Claims missen onderbouwing
Mythos wordt gepresenteerd als een zeer krachtig algoritme. Er zijn echter geen openbare gegevens die de claims staven. Zonder testresultaten is het niet duidelijk of het model echt beter presteert dan toonaangevende systemen.
Bedrijven gebruiken vaak benchmarks om prestaties te meten. Dat zijn vaste toetsen voor taken als redeneren, taal, of programmeren. Voor Mythos zijn zulke cijfers op het moment van schrijven niet gedeeld.
Ook ontbreekt een technische beschrijving die uitlegt hoe het model is getraind. Een modelkaart is hiervoor gangbaar. Die kaart beschrijft doel, data, beperkingen en bekende risicoās in eenvoudige taal.
āZonder openbare testen blijft āsupersterkā een marketingterm.ā
Geen publieke demo of paper
Een publieke demo of API laat gebruikers zelf ervaren wat wel en niet werkt. Voor Mythos is zoān toegang niet breed beschikbaar, of alleen op uitnodiging. Dat maakt onafhankelijke controle lastig.
Een wetenschappelijke paper helpt bij duiding. Daarin staat normaal hoe het systeem is gebouwd, met welke datasets, en met welke rekenkracht. Zoān document ontbreekt nu, waardoor vakgenoten de methode niet kunnen toetsen.
Transparantie is extra belangrijk bij generieke modellen, ook wel general-purpose AI genoemd. Dat zijn systemen die veel soorten taken kunnen uitvoeren. Ze worden vaak hergebruikt in overheid, zorg en onderwijs.
EU-regels vragen transparantie
De Europese AI-verordening (AI Act) stelt eisen aan general-purpose AI. Ontwikkelaars moeten onder meer een samenvatting van trainingsdata, evaluaties en bekende risicoās publiceren. Bij zeer krachtige modellen gelden strengere plichten voor veiligheidstesten en risicobeperking.
Deze regels zijn bedoeld om misleiding en schade te beperken. Organisaties moeten kunnen zien of een model geschikt is voor hun taak. Zonder documentatie is dat niet goed te beoordelen.
Het Europese AI Office coƶrdineert toezicht, met nationale toezichthouders in elke lidstaat. In Nederland wordt deze taakverdeling op het moment van schrijven verder uitgewerkt. Publieke instellingen moeten intussen al kiezen voor systemen die aan de nieuwe plichten kunnen voldoen.
Risicoās voor misinformatie en AVG
Als een model onduidelijk is over herkomst van data, ontstaat risico op auteursrechtproblemen. De AVG vereist bovendien dat persoonsgegevens zorgvuldig en doelgebonden worden gebruikt. Zonder dataminimalisatie en versleuteling kan inzet in de publieke sector botsen met privacyregels.
Een krachtig taalmodel kan overtuigende maar foutieve teksten maken. Dat vergroot de kans op misinformatie, zeker zonder duidelijke gebruiksgrenzen. Instellingen moeten daarom waarborgen hebben, zoals inhoudsfilters en logging.
Ook maatschappelijke impact telt. Denk aan discriminatie door vooringenomen trainingsdata. Daarvoor zijn bias-tests en correcties nodig, die nu niet openbaar zijn voor Mythos.
Wat organisaties nu moeten vragen
Overheden, scholen en zorginstellingen doen er goed aan standaardvragen te stellen. Vraag om modelkaarten, evaluatierapporten en een samenvatting van trainingsdata. Controleer ook contentherkomst of watermerken voor gegenereerde media.
Voor gevoelige taken is een proefopstelling met toezicht verstandig. Leg vast welke data het systeem ziet en hoe uitkomsten worden beoordeeld. Zorg dat een mens eindverantwoordelijk blijft bij beslissingen met impact.
Kijk tot slot naar contracten en exitopties. Voorkom afhankelijkheid van ƩƩn leverancier zonder export van data of logs. Dat beperkt risicoās als prestaties tegenvallen of regels wijzigen.
Debat toont kloof marketing en bewijs
De discussie rond Mythos laat een bekend patroon zien. Nieuwe AI-modellen krijgen snel veel aandacht, maar harde metingen volgen later of blijven uit. Daardoor is het moeilijk om claims te wegen.
Transparantie en reproduceerbare tests zijn de basis voor vertrouwen. Dat past ook bij de lijn van de AI-verordening in Europa. Wie vroeg inzet op documentatie en veiligheid, wint straks tijd bij audits en aanbestedingen.
Voor nu is de boodschap nuchter: wacht op data, niet op slogans. Pas dan valt te bepalen of Mythos echt iets nieuws brengt. En of het model geschikt is voor gebruik in de Nederlandse en Europese praktijk.
