Anthropic, maker van de AI-assistent Claude, waarschuwde de afgelopen dagen voor misbruik van generatieve systemen in de biowetenschap. Het bedrijf stelt dat krachtige modellen het makkelijker maken om gevaarlijke experimenten te plannen. Die boodschap zorgt voor debat in de techsector in Europa en Nederland. Critici zien een strategie om strengere regels te sturen die grote spelers bevoordeelt.
Risicoverhaal wordt aangescherpt
Anthropic presenteerde nieuwe waarschuwingen over bioveiligheid en kunstmatige intelligentie. Generatieve AI is software die tekst of code maakt op basis van voorbeelden. Volgens het bedrijf kunnen modellen zoals Claude 3 bepaalde stappen uitleggen die onwenselijk zijn. Het stelt daarom extra veiligheidslagen voor bij toekomstige versies.
Het bedrijf koppelt dit aan een Responsible Scaling Policy, een interne leidraad voor groei. Daarin staan drempels en tests om het misbruik van modellen te beperken. Denk aan strengere evaluaties, beperkte trainingsdata en meer menselijke controle. Zo moet het systeem minder hulp bieden bij gevaarlijke verzoeken.
De toon is scherp en gaat over zeldzame, maar ernstige risicoās. Dat werkt door in het publieke debat in Europa. Beleidsmakers en onderzoekers vragen om bewijs dat de risicoās nu al materieel zijn. Zonder duidelijkheid kan dit gesprek snel polariseren.
Onderbouwing blijft beperkt
Een centraal punt van kritiek is de onderbouwing. Interne tests zijn moeilijk te beoordelen door buitenstaanders. Methoden, datasets en criteria zijn vaak niet openbaar. Daardoor is herhaalbaar onderzoek lastig.
Onafhankelijke verificatie is nodig om beleid op te baseren. Europese normalisatie via CEN en CENELEC kan hier helpen. Denk aan gestandaardiseerde veiligheidstesten voor generatieve systemen. Zo wordt duidelijk wat een model wel en niet kan.
Transparantie gaat niet om broncode alleen. Het gaat ook om protocollen, metrics en foutmarges. Zonder die basis dreigt beleid op aannames te rusten. Dat is risicovol voor innovatie Ʃn veiligheid.
Belang bij strengere regels
Grote labs hebben middelen om zware compliance-eisen te dragen. Voor kleinere spelers is dat moeilijker. Strenge, brede regels kunnen de markt consolideren. Dat vergroot de macht van een paar bedrijven.
Anthropic werkt samen met andere grote namen in veiligheidsfora. Zulke coalities adviseren over evaluaties en incidentmeldingen. Dat is nuttig, maar kan ook de lat verleggen in hun voordeel. Toezichthouders moeten daar oog voor hebben.
De Europese AI-verordening (AI Act) maakt onderscheid voor modellen met systemisch risico. Voor deze groep gelden extra plichten zoals modelcontroles, documentatie en risicobeperking. Dat is logisch bij grote impact. Maar de criteria moeten precies en toetsbaar zijn.
In de AI-verordening geldt een compute-drempel van 10^25 FLOPs als indicatie voor āsystemisch risicoā, met extra verplichtingen voor zulke generatieve modellen.
Gevolgen voor open modellen
Europa leunt op open innovatie met partijen als Mistral en Aleph Alpha. Open modellen helpen mkb en onderzoekers met betaalbare AI. Te strakke regels kunnen dit afremmen. Zeker als alle generatieve systemen over ƩƩn kam worden geschoren.
De AI-verordening bevat uitzonderingen voor open-source, behalve bij systemisch risico. Dat houdt de deur open voor gedeelde kennis. Maar extra druk rond bioveiligheid kan de ruimte kleiner maken. Dan verschuift het voordeel naar gesloten modellen.
Nederlandse organisaties willen juist keuzevrijheid en transparantie. Gemeenten, ziekenhuizen en hogescholen testen lokaal draaiende modellen. Zij hebben belang bij duidelijke, risicogebaseerde eisen. Niet bij algemene verboden die bruikbare toepassingen raken.
Wat werkt in de praktijk
Gerichte mitigaties leveren nu al resultaat. Dat zijn onder meer dataset-schoonmaak, instructiefilters en red-teaming. Red-teaming is het bewust zoeken naar gaten door een testteam. Zo worden ongewenste antwoorden eerder ontdekt en geblokkeerd.
Loggen en auditen helpen misbruik op te sporen. Ook ātooling-sandboxingā beperkt schade door externe acties van een model. Samen met menselijke beoordeling voorkomt dit escalatie. Dit is uitvoerbaar voor zowel open als gesloten systemen.
AVG-regels blijven daarnaast leidend. Biologische en gezondheidsdata zijn gevoelig en vragen dataminimalisatie en beveiliging. Europese instellingen moeten dit al meenemen in inkoop en pilots. Dat past bij de gefaseerde invoering van de AI-verordening vanaf 2025-2026.
Nodig: onafhankelijk toetsen
Het debat vraagt om feiten, niet angst. Onafhankelijke, herhaalbare evaluaties zijn de kern. Universiteiten, keuringsinstanties en open labs kunnen dit doen. Met gedeelde benchmarks en rapporten die publiek zijn.
De nieuwe Europese AI Office krijgt hier een rol in. Nationale toezichthouders zoals de Autoriteit Persoonsgegevens en de Rijksinspectie Digitale Infrastructuur kunnen aansluiten. Duidelijke spelregels maken sneller handelen mogelijk. Dat helpt bij incidenten en bij gezond experimenteren.
Zo ontstaat een evenwichtige lijn. Geen paniek, wel meetbare veiligheid. Bedrijven als Anthropic leveren input, maar niet de norm alleen. Die hoort in publieke handen, met brede toetsing.
