• Home
  • /
  • Nieuws
  • /
  • OpenAI’s ChatGPT en Amazon KDP onder vuur: AI-boeken met gestolen teksten

Door Dave

mei 24, 2026

In online boekhandels verschijnen steeds meer door AI geschreven boeken. Die teksten lijken soms sterk op werk van echte schrijvers, omdat trainingsdata uit illegale kopieƫn komt. Dit speelt in Nederland en in de rest van Europa, en zorgt voor juridische en ethische vragen. De discussie over Europese AI-verordening gevolgen overheid en uitgevers wordt urgenter, omdat regels en toezicht snel veranderen.

AI-boeken kopiƫren bestaande teksten

Generatieve AI is software die nieuwe tekst maakt op basis van enorme hoeveelheden voorbeeldteksten. Modellen zoals GPT-4 van OpenAI, Gemini van Google en Llama van Meta voorspellen woord voor woord wat waarschijnlijk volgt. Dat werkt goed voor snelheid en samenhang, maar kan ook leiden tot het letterlijk herhalen van zinnen uit het geheugen van het model. Dit risico groeit als trainingsdata ongefilterd en zonder toestemming is verzameld.

Met zelfpublicatieplatformen zoals Amazon Kindle Direct Publishing kunnen makers in enkele uren een ā€œnieuwā€ boek online zetten. Sommige van deze titels bevatten passages die sterk doen denken aan bestaande romans of non-fictie. Kwaliteitscontrole schiet vaak tekort, waardoor dubieuze boeken tijdelijk online blijven. Lezers en auteurs merken dat pas op na aankoop of wanneer overeenkomsten openbaar worden gedeeld.

Onderzoekers tonen aan dat grote taalmodellen onder bepaalde prikkels teksten uit trainingssets bijna woordelijk kunnen reproduceren. Dit gebeurt vooral bij minder bekende of vaak herhaalde passages. De grens tussen ā€˜in stijl schrijven’ en ā€˜kopiĆ«ren’ is technisch dun, maar juridisch cruciaal. Juist dat maakt handhaving en bewijs lastig voor platforms en rechthebbenden.

Omstreden dataset Books3

In de kern van het probleem staat de herkomst van trainingsdata. De omstreden dataset Books3 bevatte volledige boeken die zonder toestemming online waren gezet en daarna zijn gebundeld. Onderzoekers en ontwikkelaars gebruikten de set voor het trainen en testen van open modellen. Daarmee belandden complete, auteursrechtelijk beschermde werken in de leercycli van algoritmen.

Books3 bevat circa 183.000 volledige boeken uit illegale bronnen, die als trainingsdata zijn gebruikt.

Auteurs en uitgevers stellen dat dit neerkomt op ongeoorloofd kopiƫren en hergebruik. Techbedrijven beroepen zich geregeld op uitzonderingen zoals fair use in de VS of tekst- en datamijnbouw in de EU. In de praktijk is toestemming zelden expliciet gevraagd of vastgelegd. Dat leidt tot rechtszaken, schikkingen en een roep om duidelijke licenties.

Ook open-sourcegemeenschappen worstelen met de erfenis van dergelijke datasets. Sommige verzamelingen zijn offline gehaald of gelabeld, maar kopieƫn blijven circuleren. Transparantie over gebruikte data is nog geen vaste praktijk. Zonder heldere bronvermelding blijft het voor schrijvers onmogelijk om na te gaan of hun werk is gebruikt.

Platforms pakken misbruik aan

Grote winkels en uitgevers zetten stappen, maar met wisselend resultaat. Amazon KDP vraagt sinds 2023 om te melden of een boek met AI is gemaakt en beperkt het aantal dagelijkse uploads. Toch glippen problematische titels door de controle, mede omdat automatische detectie van AI-tekst onbetrouwbaar is. Handmatige beoordeling kost tijd en schaalbaar is die aanpak niet.

Andere winkels, zoals Apple Books en Kobo, leggen de verantwoordelijkheid vooral bij uitgevers en distributeurs. In Europa stuurt de Digital Services Act grote platforms aan op beter risicobeheer en klachtenafhandeling. Dat kan leiden tot snellere verwijdering en betere herkomstlabels. Voor kleinere platforms betekent dit extra kosten en nieuwe procedures.

Detectie blijft een technisch mijnenveld. AI-watermerken en classificatietools werken onvolledig en zijn gemakkelijk te omzeilen. Daarom vragen brancheorganisaties om ā€œcontent provenanceā€: digitale herkomstlabels die meereizen met een tekst. Zonder zo’n ketenbewijs blijft het voor lezers onduidelijk wat ze kopen.

Europese AI-verordening: gevolgen overheid

De Europese AI-verordening (AI Act) legt generatieve systemen transparantieplichten op. Zo moeten aanbieders duidelijk maken hoe ze omgaan met auteursrechtelijk beschermd materiaal en welke maatregelen ze nemen tegen inbreuk. Ook kunnen lidstaten toezichthouders aanwijzen die klachten behandelen en sancties opleggen. Voor overheden betekent dit straks nieuwe taken bij inkoop en toezicht.

Daarnaast geldt in de EU het auteursrechtkader met uitzonderingen voor tekst- en datamijnbouw. Rechthebbenden mogen een machineleesbare opt-out publiceren om scraping te verbieden. Wie die opt-out negeert, loopt juridisch risico, zeker bij commercieel gebruik. Dit dwingt ontwikkelaars richting licenties of schoongefilterde datasets.

Als trainingsdata ook persoonsgegevens bevat, geldt de AVG. Ontwikkelaars moeten dan een geldige grondslag hebben, dataminimalisatie toepassen en risico’s beperken. Memoirs en non-fictie kunnen dergelijke gegevens bevatten, wat extra zorgplicht meebrengt. Voor publieke instellingen wegen deze eisen, op het moment van schrijven, extra zwaar bij de inzet van AI-teksten.

Nederland zoekt heldere afspraken

In Nederland pleiten auteurs- en uitgeversorganisaties voor licentiemodellen en transparantie over gebruikte data. Zij willen dat AI-bedrijven vooraf afspraken maken over vergoeding en bronvermelding. Ook vragen zij platforms om snelle verwijdering van titels die te veel lijken op bestaand werk. Dat moet de schade voor schrijvers en het vertrouwen van lezers beperken.

Boekverkopers en bibliotheken vragen om duidelijke labels bij AI-gegenereerde werken. Een zichtbaar herkomstlabel helpt bij selectie, collectiebeleid en klachtenafhandeling. Voor het onderwijs is herkomstinformatie belangrijk bij leeslijsten en leermiddelen. Zo voorkomen scholen dat dubieuze titels in het curriculum terechtkomen.

Consumenten kunnen zelf ook alert zijn. Let op plotselinge stijlwisselingen, herhalingen en onlogische alinea’s. Controleer de uitgever en publicatiedatum, en wees kritisch bij extreem lage prijzen. Meld vermoedens van plagiaat bij de winkel en de uitgever, zodat titels sneller worden onderzocht en zo nodig verwijderd.

Over de schrijver 

Dave

Hoi, ik ben Dave – schrijver, onderzoeker en nieuwsgierige geest achter AIInsiders.nl. Ik hou me bezig met de manier waarop technologie ons leven verandert, en vooral: hoe we dat een beetje kunnen bijbenen. Van slimme tools tot digitale trends, ik duik graag in de wereld achter de schermen.

Mijn stijl? Lekker helder, soms kritisch, altijd eerlijk. Geen onnodig jargon of overdreven hype, maar praktische inzichten waar je echt iets aan hebt. AI is niet eng of magisch – het is interessant, en ik help je graag om dat te zien.

Meer lezen

16/06/2026 07:31

Anthropic heeft deze week de toegang tot enkele nieuwe AI-modellen tijdelijk uitgeschakeld op zijn platform. Het Amerikaanse bedrijf doet dat na een exportbeperking die de lees verder

VS-exportbeperking dwingt Anthropic nieuwe AI-modellen te blokkeren

15/06/2026 21:52

Anthropic, het bedrijf achter de Claude-assistent, schakelt zijn meest geavanceerde AI-modellen uit voor gebruikers buiten de Verenigde Staten. De maatregel geldt op het moment van lees verder

Anthropic moet geavanceerde Claude-AI uitschakelen voor niet-Amerikanen

15/06/2026 19:49

In Nederland en andere Europese landen kiezen sommige mensen voor een symbolisch huwelijk met een voorwerp, met een AI-chatbot of met zichzelf. De ceremonies vinden lees verder

Trouwen met AI (Replika), een voorwerp (Gatebox) of jezelf — waarom?

15/06/2026 17:46

Anthropic heeft de jailbreak-prompts ā€œFable 5ā€ en ā€œMythos 5ā€ in zijn AI-assistent Claude geblokkeerd. De maatregel moet misbruik tegengaan en scherpt de veiligheidsfilters aan. De lees verder

Claude Fable 5 en Mythos 5 geblokkeerd — is AI te gevaarlijk?
>