Nieuws

Hongerige wolven: hoe AI en big tech onze data blijven verslinden

Geschreven door Matthijs

December 11, 2025 15:24

Nieuwsuitgevers in Nederland en Europa maken zich zorgen over generatieve AI die massaal nieuws kopieert voor training. Zij vragen om duidelijke afspraken, licenties en toezicht. Dit speelt nu, omdat de EU de AI-verordening (AI Act) invoert en uitgevers hun rechten willen borgen. De discussie raakt ook de bredere Europese digitalisering gevolgen bedrijfsleven en media.

AI traint op nieuwsdata

Generatieve AI-systemen zoals ChatGPT van OpenAI en Gemini van Google hebben grote hoeveelheden tekst nodig om te leren. Bedrijven gebruiken webcrawlers, zoals GPTBot en CCBot, om publieke pagina’s te kopiëren. Een webcrawler is software die automatisch websites bezoekt en inhoud downloadt. Nieuwsartikelen en archieven zijn daarbij extra waardevol, omdat ze actueel en zorgvuldig geredigeerd zijn.

Uitgevers zien dat AI-assistenten antwoorden geven zonder door te linken naar de bron. Dat drukt het verkeer naar nieuwswebsites en daarmee advertentie- en abonnementsinkomsten. Dit zet investeringen in onafhankelijke journalistiek onder druk. Het gaat daarom niet alleen om techniek, maar ook om het verdienmodel van media.

AI-bedrijven bieden steeds vaker licenties aan voor gebruik van nieuwscontent. Tegelijk blokkeren veel redacties crawlers via robots.txt of serverinstellingen. Die maatregelen werken alleen vooruit, niet terug in de tijd. Data die al in trainingssets zitten, blijven lastig te verwijderen.

Op het moment van schrijven experimenteren meerdere platforms met “noai”- en “noimageai”-signalen. Dat zijn niet-gestandaardiseerde instructies om AI-training te beperken. Niet elke crawler respecteert die signalen even strikt. Daardoor blijft handhaving voor uitgevers complex en fragmentarisch.

Uitgevers claimen auteursrecht

In de EU beschermt de DSM-richtlijn (2019/790) het online hergebruik van perspublicaties. Dit zogenoemde persuitgeversrecht is in Nederland in de Auteurswet opgenomen. Het geeft uitgevers een onderhandelingspositie tegenover digitale diensten. Licenties en vergoeding worden zo juridisch beter afdwingbaar.

Voor het analyseren van content geldt de regel rond text and data mining (TDM). TDM is het geautomatiseerd doorzoeken van teksten en beelden om patronen te vinden. Artikel 4 van de richtlijn staat TDM door bedrijven toe, maar alleen als rechthebbenden geen voorbehoud hebben gemaakt. Dat voorbehoud moet bij voorkeur machineleesbaar zijn, bijvoorbeeld via robots.txt.

EU-regel in het kort: TDM mag voor commerciële partijen, tenzij de rechthebbende vooraf een duidelijk, machineleesbaar voorbehoud maakt.

In de praktijk gebruiken uitgevers meerdere lagen: robots.txt, HTTP-headers en crawlerblokkades per user-agent. Ook zetten zij juridische brieven in om ongewenste kopieën te laten verwijderen. Toch zijn datasets vaak verspreid over verschillende partijen. Dat maakt toezicht en bewijsvoering tijdrovend en kostbaar.

AI Act dwingt transparantie

De AI Act legt verplichtingen op aan aanbieders van general-purpose AI, zoals grote taalmodellen. Zij moeten technische documentatie bijhouden en een “toereikende samenvatting” van trainingsdata publiceren. Ook moeten zij het EU-auteursrecht naleven, inclusief TDM-voorbehouden. Nationale toezichthouders en een Europees AI-orgaan gaan hierop controleren.

Naast auteursrecht speelt privacyrecht (AVG) een grote rol. Training met persoonsgegevens vereist een geldige grondslag en dataminimalisatie. Betrokkenen hebben recht op informatie, inzage en soms verwijdering. Het verwijderen van data “uit” een model is technisch lastig, wat nieuwe compliance-oplossingen vraagt.

Overtredingen kunnen leiden tot forse boetes onder de AI Act. Ook reputatierisico’s nemen toe als herkomst van data onduidelijk is. Transparantie over datasets en licenties wordt daarmee een strategische noodzaak. Dat geldt zowel voor Amerikaanse als Europese AI-aanbieders.

Voor publieke instellingen en bedrijven in de EU betekent dit meer due diligence. Wie AI inkoopt, zal leveranciers moeten bevragen op dataprovenance. Contracten krijgen clausules over auteursrecht en AVG. Dit raakt direct aan Europese digitalisering en de gevolgen voor het bedrijfsleven.

Nederlandse praktijk en deals

In Nederland vertegenwoordigt NDP Nieuwsmedia de meeste nieuwsuitgevers. Zij pleiten voor heldere opt-outmechanismen en eerlijke vergoedingen. Ook vragen zij om actieve handhaving van het persuitgeversrecht. Daarmee moet de positie van redacties in het digitale domein worden versterkt.

Internationaal sluiten uitgevers licenties met AI-bedrijven. Bekende voorbeelden zijn deals van Axel Springer en de Financial Times met OpenAI, en van Associated Press met OpenAI. Zulke afspraken geven beperkte toegang tot archieven en regelen bronvermelding en vergoeding. De details verschillen per contract en worden niet altijd openbaar.

Nederlandse titels experimenteren met vergelijkbare trajecten en blokkades. Veel redacties hebben GPTBot of CCBot uitgesloten. Tegelijk willen zij zichtbaar blijven in zoekmachines en nieuwsapps. De balans tussen vindbaarheid en controle is daardoor fragiel.

De overheid kijkt mee vanuit innovatie- en mediabeleid. Het doel is een gezonde markt met ruimte voor vernieuwing en pluralisme. Publieke financiering en private licenties moeten elkaar daarbij aanvullen. Toezicht op naleving van EU-regels blijft essentieel.

Gevolgen voor gebruikers en markt

Voor uitgevers is het advies om beleid en techniek te combineren. Inventariseer contentrechten, zet machineleesbare voorbehouden aan en monitor crawlerverkeer. Overweeg licenties als dat past bij de strategie. Houd juridische en technische logs bij voor bewijs.

AI-aanbieders doen er goed aan om dataset-herkomst te documenteren. Respecteer robots.txt en specifieke user-agents, en filter persoonsgegevens. Bied een contactpunt voor klachten en verwijderverzoeken. Publiceer samenvattingen van datasets zoals de AI Act vereist.

Voor het brede publiek blijft bronvermelding belangrijk. AI-antwoorden kunnen gebaseerd zijn op recente artikelen zonder context. Klik door naar primaire bronnen voor nuance en actualiteit. Zo blijft de informatieketen controleerbaar en betrouwbaar.

Voor de Europese markt is dit een lakmoesproef. Rechten, innovatie en privacy moeten in balans komen. Heldere regels en werkbare tools helpen daarbij. Zo kan digitalisering de journalistiek versterken in plaats van uithollen.

Andere bekeken ook

January 22, 2026

Wattmeters en data-analyse: hoe technologie Jay Vine aan dubbelslag hielp

January 22, 2026

EU-tegenmaatregelen bedreigen Amerikaanse techreuzen: wat staat hen te wachten?