EU onderzoekt of Google online content gebruikt om AI te trainen

  • Home
  • >
  • Blog
  • >
  • Nieuws
  • >
  • EU onderzoekt of Google online content gebruikt om AI te trainen

Amsterdam, 21 december 2025 07:31 

De Europese Commissie onderzoekt hoe Google online inhoud gebruikt voor zijn AI-diensten. Het gaat om trainingsdata en uitkomsten in systemen zoals Gemini. Brussel wil weten of auteursrechten en privacyregels worden gerespecteerd. De uitkomst kan gevolgen hebben voor mediabedrijven en overheden, ook door de Europese AI-verordening.

Brussel vraagt opheldering

De Commissie heeft Alphabet, het moederbedrijf van Google, om informatie gevraagd. De vragen richten zich op het verzamelen en hergebruik van teksten, beelden en audio vanaf het web. Ook wil Brussel duidelijkheid over de werking van Gemini en eventuele AI-functies in Zoeken.

Centraal staat of Google toestemming of licenties heeft voor beschermde inhoud. Daarnaast vraagt de Commissie hoe het bedrijf omgaat met websites die AI-scraping verbieden. Het gaat om signalen zoals robots.txt of speciale opt-out tags.

De toezichthouder wil ook weten welke interne controles Google toepast. Denk aan filters om gevoelige data uit trainingssets te houden. En procedures om fouten of misleiding door het model te beperken.

Auteursrecht en opt-out centraal

In de EU hebben uitgevers een naburig recht op online hergebruik van hun artikelen. Voor training of weergave van perscontent kan daarom een licentie nodig zijn. Het onderzoek kijkt of Google deze rechten respecteert in zijn algoritmen.

Websites kunnen met robots.txt en met de Google-Extended-tag aangeven dat data niet voor modeltraining mag worden gebruikt. De vraag is of die signalen technisch en organisatorisch worden afgedwongen. Onzekerheid hierover is een belangrijk punt in het onderzoek.

De AI-verordening verplicht ontwikkelaars van algemene modellen tot transparantie over trainingsdata. Zij moeten een samenvatting publiceren en EU-auteursrecht respecteren. Die regels krijgen direct impact op modellen zoals Gemini in de EU.

De AI-verordening vereist dat ontwikkelaars van algemene AI-modellen een publiek toegankelijke samenvatting van de trainingsdata geven en Europese auteursrechten respecteren.

Privacyregels gelden onverkort

Als trainingsdata persoonsgegevens bevatten, geldt de AVG. Een bedrijf moet dan een rechtsgrond hebben, data minimaliseren en doelen beperken. Dat geldt extra streng voor bijzondere persoonsgegevens en data van minderjarigen.

Voor grote platforms speelt ook de Digital Markets Act. Gatekeepers zoals Alphabet mogen zonder duidelijke toestemming geen persoonsgegevens combineren tussen diensten. AI-training die data uit meerdere bronnen samenbrengt, valt onder die toets.

Daarnaast kan de Digital Services Act eisen stellen aan risico’s van generatieve systemen. Denk aan desinformatie, deepfakes en transparantie over herkomst. De Commissie kan hiervoor extra maatregelen of audits vragen.

Effect op Nederlandse nieuwssector

Nederlandse uitgevers willen grip op hoe hun artikelen in datamodellen belanden. Organisaties als NDP Nieuwsmedia pleiten voor heldere licenties en werkende opt-outs. Het onderzoek kan hun positie bij onderhandelingen versterken.

AI-functies in zoekmachines kunnen verkeer weghalen bij nieuwswebsites. Minder klikken betekent minder advertentie- en abonnee-inkomsten. Daarom is duidelijke afbakening tussen citeren, samenvatten en herpubliceren belangrijk.

Ook publieke instellingen krijgen hiermee te maken. Bij inkoop van AI-diensten moeten zij letten op herkomst en licenties van trainingsdata. De Europese AI-verordening gevolgen overheid zijn hier direct: transparantie en naleving worden in aanbestedingen gevraagd.

Wat staat Google te doen

Google zal moeten aantonen dat het auteursrechten en privacy respecteert. Denk aan licenties, logboeken en technische handhaving van opt-outs. Ook kan extra uitleg over Gemini en datastromen nodig zijn.

Bij tekortkomingen kan de Commissie corrigerende maatregelen opleggen. Onder DSA en DMA kunnen boetes oplopen tot meerdere procenten van de wereldwijde omzet. Dat maakt naleving ook bedrijfseconomisch urgent.

Voor websitebeheerders blijven drie stappen verstandig. Stel robots.txt en relevante meta-tags in, controleer logbestanden op scraping en documenteer licentiekeuzes. Dat helpt bij gesprekken met platforms Ʃn bij eventuele klachtenprocedures.

Tijdpad en mogelijke uitkomst

De Commissie kan eerst extra informatie en toezeggingen vragen. Daarna kan een formele procedure volgen als risico’s of overtredingen blijven. Tussentijdse aanbevelingen zijn ook mogelijk.

Voor de EU-markt kan dit leiden tot strengere transparantie-eisen aan AI-functies. Gebruikers zien dan duidelijker wat door een model is gegenereerd en op welke bronnen dat rust. Ook kunnen AI-overzichten in zoeken worden aangepast of beperkt.

Voor de sector biedt dit duidelijkheid over rechten en plichten. Licentieafspraken worden waarschijnlijk belangrijker en standaarder. Dat geeft uitgevers, overheden en burgers meer controle over online inhoud in datamodellen.


Over Dave

Hoi, ik ben Dave – schrijver, onderzoeker en nieuwsgierige geest achter AIInsiders.nl. Ik hou me bezig met de manier waarop technologie ons leven verandert, en vooral: hoe we dat een beetje kunnen bijbenen. Van slimme tools tot digitale trends, ik duik graag in de wereld achter de schermen.

Mijn stijl? Lekker helder, soms kritisch, altijd eerlijk. Geen onnodig jargon of overdreven hype, maar praktische inzichten waar je echt iets aan hebt. AI is niet eng of magisch – het is interessant, en ik help je graag om dat te zien.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Misschien ook interessant

>