Meerdere scholen in Nederland starten dit schooljaar met kunstmatige intelligentie om toetsen na te kijken. Het gaat om pilots in het voortgezet onderwijs en mbo, gericht op sneller beoordelen en minder werkdruk. De systemen geven een eerste beoordeling van open en meerkeuzevragen, die een docent controleert. Dit gebeurt terwijl de AVG en de Europese AI-verordening (AI Act) strenge eisen stellen aan gebruik in het onderwijs.
AI-nakijken zet door
Scholen testen momenteel algoritmen die antwoorden van leerlingen analyseren en een score of feedback voorstellen. Het doel is tijdwinst en consistenter beoordelen, vooral bij grote groepen. Docenten blijven verantwoordelijk voor de eindscore en passen waar nodig het advies aan. Leveranciers koppelen de functies aan bestaande toetsplatformen die scholen al gebruiken.
De eerste inzet is meestal bij meerkeuzevragen en korte open antwoorden. Daar kan een systeem snel herkenbare patronen vinden. Bij langere betogen of vakken als geschiedenis en Nederlands is het lastiger. Dan helpt AI vooral met sorteren, rubriceren en het markeren van opvallende passages.
Organisaties als Kennisnet en SURF publiceren op het moment van schrijven handreikingen voor veilig en zinvol gebruik. Zij wijzen op het belang van duidelijke beoordelingsmodellen, zogeheten rubrics. Ook adviseren zij om AI alleen als hulpmiddel te zien, niet als vervanger van de docent. Scholen bouwen daarom extra controles in het proces in.
Resultaten nog wisselend
De betrouwbaarheid verschilt per vak en vraagtype. Bij vaste antwoorden, zoals rekenstappen of definities, scoren modellen vaak goed. Bij creatief of genuanceerd werk kan de beoordeling schommelen. Kleine verschillen in formulering leiden dan soms tot andere uitkomsten.
Een bekend risico is dat generatieve modellen soms onjuiste maar zelfverzekerde uitleg geven. Dat heet hallucineren: het systeem verzint dan een redenering of bron. Dit is vooral een probleem bij open vragen zonder strak antwoordmodel. Extra instructies en voorbeelden in de prompt verminderen dat risico, maar nemen het niet weg.
Eerlijkheid is een tweede zorgpunt. Modellen kunnen onbewust bevooroordeeld zijn door hun trainingsdata. Dat kan nadelig zijn voor bepaalde taalvarianten of schrijfwijzen. Scholen testen daarom met diverse leerlinggroepen en laten de docent altijd de laatste beslissing nemen.
Mens houdt laatste woord
De AI-verordening van de Europese Unie classificeert AI voor beoordeling in onderwijs als hoog risico. Dat betekent verplichte menselijk toezicht, duidelijke documentatie en logging van beslissingen. Scholen moeten dus kunnen uitleggen hoe een score tot stand komt. Ook moet een leerling bezwaar kunnen maken en een menselijke herbeoordeling krijgen.
Praktisch betekent dit: geen āautopilotā bij nakijken. De docent controleert steekproefsgewijs of volledig, afhankelijk van het vak en de toets. Daarnaast bewaart de school de onderbouwing van de beoordeling. Dit maakt kwaliteitscontrole en audits mogelijk.
Leveranciers moeten technische dossiers en risicobeoordelingen leveren. Zij laten zien hoe het model is getest en welke grenzen gelden. Scholen kiezen bij voorkeur oplossingen met transparante rubrics en instelbare criteria. Zo blijft het toetsbeleid leidend en niet het algoritme.
AI in onderwijs dat de toegang tot onderwijs of beoordeling van leerlingen beĆÆnvloedt, valt onder hoog-risico in de EU AI Act en vereist aantoonbaar menselijk toezicht.
AVG stelt strenge grenzen
Het nakijken met AI verwerkt persoonsgegevens van leerlingen. De AVG eist dataminimalisatie: verwerk zo weinig mogelijk data voor dit doel. Anonimiseer waar mogelijk en verwijder ruwe antwoorden zodra de beoordeling is afgerond. Leg dit vast in heldere bewaartermijnen.
Een Data Protection Impact Assessment (DPIA) is vaak nodig. Die analyseert de risicoās en de maatregelen, zoals versleuteling en toegangscontrole. Scholen sluiten verwerkersovereenkomsten met leveranciers. Daarin staat dat data niet worden gebruikt om modellen verder te trainen.
Opslag in de EU is voor veel besturen nu een harde eis. Dit beperkt de kans op doorgifte naar derde landen. De Autoriteit Persoonsgegevens adviseert daarnaast goede voorlichting aan ouders en leerlingen. Denk aan uitleg over doelen, rechten en bezwaarprocedures.
Zo pakken scholen het aan
Begin kleinschalig met ƩƩn vak en een duidelijk rubric. Laat meerdere docenten dezelfde set antwoorden beoordelen en vergelijk dit met het AI-advies. Zo ontstaat zicht op waar het systeem helpt en waar het struikelt. Pas daarna op naar grotere toetsen en meer vraagtypes.
Gebruik AI eerst voor ondersteunende taken. Denk aan het ordenen van antwoorden, het signaleren van ontbrekende stappen of het genereren van conceptfeedback. De docent past de toon aan en voegt vakinhoud toe. Dit scheelt tijd zonder de beoordeling uit handen te geven.
Maak beleid en betrek de medezeggenschap. Leg vast hoe prompts, datasets en logs worden beheerd. Train docenten in het herkennen van systeemfouten en vooringenomenheid. Evalueer elk kwartaal en publiceer de uitkomsten binnen de schoolgemeenschap.
Wat verandert er nu
AI-nakijken verschuift werk van tellen en turven naar beoordelen en uitleggen. Docenten houden meer tijd over voor mondelinge toelichting en verdieping. Leerlingen krijgen sneller feedback na een toets. Voorwaarde is wel dat het systeem goed is ingesteld en begeleid.
De komende twee jaar treden onderdelen van de AI Act gefaseerd in werking. Scholen en leveranciers moeten daarom nu al aan documentatie en toezicht werken. Wie dat op orde heeft, kan sneller opschalen. Wie dat niet doet, loopt juridische en reputatierisicoās.
De kern blijft gelijk: de leraar beslist. AI is een hulpmiddel dat consistentie en snelheid kan bieden. Maar zonder transparantie en menselijke controle is het ongeschikt voor beoordeling. Nederlandse en Europese regels maken die balans expliciet en afdwingbaar.
