maart 18, 2026

EVO 2: AI leert DNA lezen én schrijven

Onderzoekers hebben een kunstmatige intelligentie ontwikkeld die de taal van het leven verstaat. Het systeem, EVO 2 genaamd, is getraind op negen biljoen DNA-bouwstenen en kan niet alleen genetische mutaties herkennen die kanker veroorzaken. Het genereert ook volledig functioneel DNA van levende organismen.

Het onderzoek is gepubliceerd in Nature, het meest gezaghebbende wetenschappelijke tijdschrift ter wereld.

Hoe werkt een AI die DNA begrijpt?

DNA bestaat uit slechts vier letters: G, C, A en T. Die letters vormen samen de bekende dubbele spiraalvorm die als blauwdruk fungeert voor alle levensprocessen. De volgorde van die letters bepaalt alles: oogkleur, ziekterisico, hoe een cel energie aanmaakt.

Het idee achter EVO 2 is elegant in zijn eenvoud. Grote taalmodellen zoals ChatGPT worden getraind op tekst van het internet en leren zo patronen in menselijke taal. De onderzoekers van het Arc Institute pasten precies dezelfde logica toe op DNA.

In plaats van webpagina's verwerkte het model een dataset genaamd Open Genome 2, een digitale bibliotheek van miljoenen organismen:

Bacteriën en schimmels
Planten en gewassen
Dieren, inclusief mensen

Het resultaat is een model dat de grammatica van het leven heeft geleerd door simpelweg enorm veel DNA te lezen.

Een geheugen van een miljoen letters

Wat EVO 2 technisch onderscheidt van eerdere pogingen, is de enorme context die het model tegelijk kan verwerken. Het systeem heeft een contextvenster van één miljoen tokens, ofwel één miljoen DNA-letters tegelijk.

Dat klinkt abstract, maar het is cruciaal. Genen werken zelden op zichzelf. Of een gen actief is, hoe sterk het tot expressie komt en wanneer het aanslaat, wordt vaak bepaald door regulatoire elementen die honderdduizenden letters verderop in de DNA-streng liggen. Voorgaande modellen konden die verbanden simpelweg niet leggen.

EVO 2 kan dat wel. Een standaardtest bevestigde dit: het model moest een specifieke reeks van honderd letters terugvinden in een willekeurige reeks van één miljoen letters, een zogeheten needle-in-a-haystack-test. Het slaagde foutloos.

Het model ontdekte de grammatica van het leven, zonder leraar

Het meest opmerkelijke is wat het systeem nooit heeft geleerd. EVO 2 ontving tijdens de training geen enkel label. Het werd nooit verteld:

Welke DNA-volgorde een ziekte veroorzaakt
Welke mutatie dodelijk is voor een cel
Wat een gen überhaupt doet

Het las alleen onbewerkt DNA van miljarden organismen die allemaal in leven zijn omdat hun genetische code werkt. Uit die evolutionaire informatie distilleerde het model zelf de regels.

Als een bepaalde reeks in honderden verschillende soorten voorkomt, is die reeks waarschijnlijk essentieel voor het leven. Als een variatie nooit in de natuur voorkomt, is dat een signaal dat ze schadelijk kan zijn.

Toen onderzoekers het model testten met bekende mutaties, waren de resultaten opvallend. EVO 2 identificeerde correct:

Welke veranderingen in start- en stopcodons fataal zijn voor een cel
De Shine-Dalgarno-sequentie en Kozak-sequentie, de aanlegplaatsen voor ribosomen
Het verschil tussen een onschuldige synonyme mutatie en een catastrofale frameshift-mutatie, waarbij één ingevoegde of verwijderde letter de volledige rest van het genetisch recept verstoort

Kankermutaties herkennen zonder medisch dossier

Een van de meest directe toepassingen toont zich in de detectie van gevaarlijke BRCA-mutaties. Dat zijn varianten in genen die, wanneer beschadigd, de kans op borst- en eierstokkanker sterk verhogen.

Voor artsen is het een enorme uitdaging om te bepalen welke van de duizenden kleine genetische variaties bij een patiënt daadwerkelijk schadelijk zijn. De onderzoekers voedden EVO 2 een grote klinische dataset in met geclassificeerde BRCA-varianten, sommige als pathogeen bestempeld, andere als goedaardig.

Het model had nooit medische dossiers gezien. Het weet niet wat kanker is. Toch slaagde het erin om de schadelijke van de onschadelijke mutaties te onderscheiden met een nauwkeurigheid die wetenschappers als buitengewoon beschrijven.

Van analyse naar creatie: volledig nieuw DNA genereren

Analyseren is één ding. Genereren is iets heel anders.

De onderzoekers gaven EVO 2 de eerste paar letters van menselijk mitochondriaal DNA, het genetisch materiaal in de energiefabriekjes van onze cellen, en vroegen het model de rest te voltooien. Vergelijkbaar met een AI die op basis van de eerste zin van een essay de rest schrijft.

Het gegenereerde DNA bevatte alle benodigde onderdelen:

Eiwitcoderende genen die aangeven wat gebouwd moet worden
Ribosomale RNA-sequenties, de fabrieksarbeiders die eiwitten assembleren
Transfer-RNA's, de moleculaire vrachtwagens die bouwstenen aanleveren

Validatie via het softwarepakket MitoZ en AlphaFold 3 van Google DeepMind bevestigde dat de gegenereerde eiwitten niet alleen de juiste structuur hadden, maar ook correct op elkaar aansloten, precies zoals in echte menselijke cellen.

Vervolgens genereerde EVO 2 het volledige genoom van een bacterie (580.000 letters) en daarna dat van een gistsoort die genetisch dichter bij de mens staat dan bij bacteriën. In beide gevallen met succes.

Veiligheidskeuzes en open source

De onderzoekers waren zich bewust van de risico's. Bij de samenstelling van de trainingsdata werden alle sequenties van virussen die mensen, dieren of planten kunnen infecteren bewust uitgesloten, waaronder de gevaarlijkste pathogenen op de USDA-lijst voor gevaarlijke biologische agentia.

Pogingen om het model achteraf toch virale sequenties te laten genereren, resulteerden in onsamenhangend genetisch materiaal zonder biologische waarde.

Toch roept de beslissing om het model volledig open source te maken serieuze vragen op. Via GitHub en Hugging Face zijn vrij beschikbaar:

De modelgewichten
De volledige trainingsdata
De trainings- en finetuningcode

Dat biedt enorme wetenschappelijke mogelijkheden, maar ook risico's. Niets weerhoudt kwaadwillenden ervan het model opnieuw te trainen op virusdata die ze zelf verzamelen.

Een nieuw tijdperk voor geneeskunde en biotechnologie

De implicaties reiken ver. Met een AI die DNA begrijpt en genereert, worden toepassingen mogelijk die tot voor kort sciencefiction leken:

Gewasgenen aanpassen voor hogere voedingswaarde of droogteresistentie
Nieuwe biosynthetische routes ontwerpen voor duurzame brandstoffen
Patiënten met ondiagnosticeerbare aandoeningen behandelen via gepersonaliseerde DNA-analyse
Prenatale screening uitbreiden naar een breed spectrum aan genetische eigenschappen

EVO 2 is geen eindpunt. Het is een fundament. De vraag is niet langer of AI de biologie zal transformeren, maar hoe snel, en onder welke spelregels.

Vorige artikel

Volgende artikel

Over de schrijver

Dave

Hoi, ik ben Dave – schrijver, onderzoeker en nieuwsgierige geest achter AIInsiders.nl. Ik hou me bezig met de manier waarop technologie ons leven verandert, en vooral: hoe we dat een beetje kunnen bijbenen. Van slimme tools tot digitale trends, ik duik graag in de wereld achter de schermen.

Mijn stijl? Lekker helder, soms kritisch, altijd eerlijk. Geen onnodig jargon of overdreven hype, maar praktische inzichten waar je echt iets aan hebt. AI is niet eng of magisch – het is interessant, en ik help je graag om dat te zien.

Meer lezen

12/05/2026 19:49

Wedbush: nieuwe OpenAI-deal versterkt Microsofts AI-ambities

Microsoft en OpenAI hebben hun samenwerking herzien. De nieuwe afspraken moeten de AI-strategie van Microsoft wereldwijd versterken, zegt analistenhuis Wedbush Securities. De deal is deze lees verder

Wedbush: nieuwe OpenAI-deal versterkt Microsofts AI-ambities

12/05/2026 17:46

Cisco overgekocht sinds 2018; topanalist voorspelt 25% groei door AI

Cisco Systems ziet zijn aandeel deze week sterk oplopen op Wall Street. Het aandeel is op het moment van schrijven technisch “overgekocht”, het hoogste niveau lees verder

Cisco overgekocht sinds 2018; topanalist voorspelt 25% groei door AI

12/05/2026 15:43

AI-analyse (OpenAI, Google Cloud) onthult loopbaan Nguyen Thanh Sinh

Nguyen Thanh Sinh, vicevoorzitter van het Provinciaal Volkscomité, bracht recente werkbezoeken aan de gemeenten Yen Binh, Thac Ba, Cam Nhan, Yen Thanh en Bao Ai lees verder

AI-analyse (OpenAI, Google Cloud) onthult loopbaan Nguyen Thanh Sinh

12/05/2026 15:36

Microsoft-aandeel stijgt door AI — wat zegt dat over de markt?

Microsoft blijft op de beurs gedreven door kunstmatige intelligentie. Beleggers verwachten meer vraag naar Azure AI en Copilot. Op het moment van schrijven ondersteunt dit lees verder

Microsoft-aandeel stijgt door AI — wat zegt dat over de markt?