EVO 2: AI leert DNA lezen én schrijven

Amsterdam, 18 maart 2026 14:08 

Onderzoekers hebben een kunstmatige intelligentie ontwikkeld die de taal van het leven verstaat. Het systeem, EVO 2 genaamd, is getraind op negen biljoen DNA-bouwstenen en kan niet alleen genetische mutaties herkennen die kanker veroorzaken. Het genereert ook volledig functioneel DNA van levende organismen.

Het onderzoek is gepubliceerd in Nature, het meest gezaghebbende wetenschappelijke tijdschrift ter wereld.


Hoe werkt een AI die DNA begrijpt?

DNA bestaat uit slechts vier letters: G, C, A en T. Die letters vormen samen de bekende dubbele spiraalvorm die als blauwdruk fungeert voor alle levensprocessen. De volgorde van die letters bepaalt alles: oogkleur, ziekterisico, hoe een cel energie aanmaakt.

Het idee achter EVO 2 is elegant in zijn eenvoud. Grote taalmodellen zoals ChatGPT worden getraind op tekst van het internet en leren zo patronen in menselijke taal. De onderzoekers van het Arc Institute pasten precies dezelfde logica toe op DNA.

In plaats van webpagina's verwerkte het model een dataset genaamd Open Genome 2, een digitale bibliotheek van miljoenen organismen:

  • Bacteriën en schimmels
  • Planten en gewassen
  • Dieren, inclusief mensen

Het resultaat is een model dat de grammatica van het leven heeft geleerd door simpelweg enorm veel DNA te lezen.


Een geheugen van een miljoen letters

Wat EVO 2 technisch onderscheidt van eerdere pogingen, is de enorme context die het model tegelijk kan verwerken. Het systeem heeft een contextvenster van één miljoen tokens, ofwel één miljoen DNA-letters tegelijk.

Dat klinkt abstract, maar het is cruciaal. Genen werken zelden op zichzelf. Of een gen actief is, hoe sterk het tot expressie komt en wanneer het aanslaat, wordt vaak bepaald door regulatoire elementen die honderdduizenden letters verderop in de DNA-streng liggen. Voorgaande modellen konden die verbanden simpelweg niet leggen.

EVO 2 kan dat wel. Een standaardtest bevestigde dit: het model moest een specifieke reeks van honderd letters terugvinden in een willekeurige reeks van één miljoen letters, een zogeheten needle-in-a-haystack-test. Het slaagde foutloos.


Het model ontdekte de grammatica van het leven, zonder leraar

Het meest opmerkelijke is wat het systeem nooit heeft geleerd. EVO 2 ontving tijdens de training geen enkel label. Het werd nooit verteld:

  • Welke DNA-volgorde een ziekte veroorzaakt
  • Welke mutatie dodelijk is voor een cel
  • Wat een gen überhaupt doet

Het las alleen onbewerkt DNA van miljarden organismen die allemaal in leven zijn omdat hun genetische code werkt. Uit die evolutionaire informatie distilleerde het model zelf de regels.

Als een bepaalde reeks in honderden verschillende soorten voorkomt, is die reeks waarschijnlijk essentieel voor het leven. Als een variatie nooit in de natuur voorkomt, is dat een signaal dat ze schadelijk kan zijn.

Toen onderzoekers het model testten met bekende mutaties, waren de resultaten opvallend. EVO 2 identificeerde correct:

  • Welke veranderingen in start- en stopcodons fataal zijn voor een cel
  • De Shine-Dalgarno-sequentie en Kozak-sequentie, de aanlegplaatsen voor ribosomen
  • Het verschil tussen een onschuldige synonyme mutatie en een catastrofale frameshift-mutatie, waarbij één ingevoegde of verwijderde letter de volledige rest van het genetisch recept verstoort

Kankermutaties herkennen zonder medisch dossier

Een van de meest directe toepassingen toont zich in de detectie van gevaarlijke BRCA-mutaties. Dat zijn varianten in genen die, wanneer beschadigd, de kans op borst- en eierstokkanker sterk verhogen.

Voor artsen is het een enorme uitdaging om te bepalen welke van de duizenden kleine genetische variaties bij een patiënt daadwerkelijk schadelijk zijn. De onderzoekers voedden EVO 2 een grote klinische dataset in met geclassificeerde BRCA-varianten, sommige als pathogeen bestempeld, andere als goedaardig.

Het model had nooit medische dossiers gezien. Het weet niet wat kanker is. Toch slaagde het erin om de schadelijke van de onschadelijke mutaties te onderscheiden met een nauwkeurigheid die wetenschappers als buitengewoon beschrijven.


Van analyse naar creatie: volledig nieuw DNA genereren

Analyseren is één ding. Genereren is iets heel anders.

De onderzoekers gaven EVO 2 de eerste paar letters van menselijk mitochondriaal DNA, het genetisch materiaal in de energiefabriekjes van onze cellen, en vroegen het model de rest te voltooien. Vergelijkbaar met een AI die op basis van de eerste zin van een essay de rest schrijft.

Het gegenereerde DNA bevatte alle benodigde onderdelen:

  • Eiwitcoderende genen die aangeven wat gebouwd moet worden
  • Ribosomale RNA-sequenties, de fabrieksarbeiders die eiwitten assembleren
  • Transfer-RNA's, de moleculaire vrachtwagens die bouwstenen aanleveren

Validatie via het softwarepakket MitoZ en AlphaFold 3 van Google DeepMind bevestigde dat de gegenereerde eiwitten niet alleen de juiste structuur hadden, maar ook correct op elkaar aansloten, precies zoals in echte menselijke cellen.

Vervolgens genereerde EVO 2 het volledige genoom van een bacterie (580.000 letters) en daarna dat van een gistsoort die genetisch dichter bij de mens staat dan bij bacteriën. In beide gevallen met succes.


Veiligheidskeuzes en open source

De onderzoekers waren zich bewust van de risico's. Bij de samenstelling van de trainingsdata werden alle sequenties van virussen die mensen, dieren of planten kunnen infecteren bewust uitgesloten, waaronder de gevaarlijkste pathogenen op de USDA-lijst voor gevaarlijke biologische agentia.

Pogingen om het model achteraf toch virale sequenties te laten genereren, resulteerden in onsamenhangend genetisch materiaal zonder biologische waarde.

Toch roept de beslissing om het model volledig open source te maken serieuze vragen op. Via GitHub en Hugging Face zijn vrij beschikbaar:

  • De modelgewichten
  • De volledige trainingsdata
  • De trainings- en finetuningcode

Dat biedt enorme wetenschappelijke mogelijkheden, maar ook risico's. Niets weerhoudt kwaadwillenden ervan het model opnieuw te trainen op virusdata die ze zelf verzamelen.


Een nieuw tijdperk voor geneeskunde en biotechnologie

De implicaties reiken ver. Met een AI die DNA begrijpt en genereert, worden toepassingen mogelijk die tot voor kort sciencefiction leken:

  • Gewasgenen aanpassen voor hogere voedingswaarde of droogteresistentie
  • Nieuwe biosynthetische routes ontwerpen voor duurzame brandstoffen
  • Patiënten met ondiagnosticeerbare aandoeningen behandelen via gepersonaliseerde DNA-analyse
  • Prenatale screening uitbreiden naar een breed spectrum aan genetische eigenschappen

EVO 2 is geen eindpunt. Het is een fundament. De vraag is niet langer of AI de biologie zal transformeren, maar hoe snel, en onder welke spelregels.


Over Dave

Hoi, ik ben Dave – schrijver, onderzoeker en nieuwsgierige geest achter AIInsiders.nl. Ik hou me bezig met de manier waarop technologie ons leven verandert, en vooral: hoe we dat een beetje kunnen bijbenen. Van slimme tools tot digitale trends, ik duik graag in de wereld achter de schermen.

Mijn stijl? Lekker helder, soms kritisch, altijd eerlijk. Geen onnodig jargon of overdreven hype, maar praktische inzichten waar je echt iets aan hebt. AI is niet eng of magisch – het is interessant, en ik help je graag om dat te zien.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Elke dag het laatste AI-nieuws ontvangen?

Schrijf je in voor onze nieuwsbrief en ontvang iedere dag het laatste AI-nieuws. Zo weet je zeker dat je altijd op de hoogte bent van updates en meer.

Misschien ook interessant

Software krijgt een nieuw prijskaartje door kunstmatige intelligentie. Bedrijven stappen versneld over op betalen naar gebruik en waarde, niet meer

HP introduceert HP IQ voor de werkplek van vandaag. Het gaat om een pakket slimme functies en diensten dat werken

Goldman Sachs werkt samen met Anthropic aan AI-agenten voor banktaken. De Amerikaanse investeringsbank wil interne processen sneller en veiliger maken,

>