17 juni 2025

DNA: De Oervorm van Data-opslag

Een zettabyte is een triljard bytes — een 1 met 21 nullen. Omgerekend: één miljoen petabytes, ofwel één biljoen gigabytes. In 2012 overschreden we voor het eerst de grens van één zettabyte aan gegenereerde data. In 2016 werd één zettabyte via internet verstuurd. En nu, in 2025? Dan produceren we naar verwachting zo’n 180 zettabyte aan data wereldwijd — een hoeveelheid die ongeveer elke twee jaar verdubbelt.

DNA: De Oervorm van Data-opslag image

Vooralsnog exponentiële groei

AI versterkt die groei exponentieel. En daarmee rijzen ook urgente vragen: Waar laten we al die data? Hoeveel moet er bewaard blijven? En hoe lang? Vragen die voor storage-engineers geen abstracte kwesties zijn, maar harde, fysieke uitdagingen. Want de cloud is geen wolk, maar een verzameling datacenters die gebouwd, gekoeld, gevoed en betaald moeten worden. We produceren inmiddels meer data dan we ooit kunnen opslaan. Veel daarvan bestaat slechts kortstondig in sensoren of streaming: gemaakt, gebruikt en weer verdwenen. Er is simpelweg niet genoeg fysieke opslagcapaciteit beschikbaar om het allemaal te bewaren.

Terwijl we systemen bouwen die schaken winnen, foto’s genereren en agenda’s beheren, blijft één verschil opvallend: zelfs de meest geavanceerde AI krabbelt pas aan het oppervlak van menselijke intelligentie. En op het gebied van data-opslag is het verschil misschien nog schrijnender. Want niets, echt niets, komt ook maar in de buurt van wat de natuur al miljarden jaren feilloos doet: DNA-gebaseerde opslag.

De Ultieme Compacte Opslag: DNA

Elke menselijke cel bevat zo’n 3 miljard baseparen aan genetische code. Dat staat gelijk aan tientallen gigabytes aan informatie — gecomprimeerd in een volume kleiner dan een stofkorrel. Zet dat af tegen onze meest geavanceerde opslagmedia en de conclusie is duidelijk: DNA is nog steeds de meest compacte, duurzame en betrouwbare opslagtechnologie die we kennen.

In een recent artikel in The New Yorker – “The Race to Save the World’s DNA” – wordt beschreven hoe onderzoekers wereldwijd experimenteren met het opslaan van digitale bestanden in synthetisch DNA. Bestanden worden vertaald naar de letters A, C, G en T, en vervolgens moleculair gesynthetiseerd. De opslagcapaciteit? Tot 215 petabyte per gram DNA. De houdbaarheid? Tientallen tot honderdduizenden jaren — mits goed bewaard.

Epigenetica: Opslag én Intelligentie

Maar de natuur doet meer dan alleen opslaan. DNA werkt ook als processor. Dankzij epigenetica — chemische schakelaars zoals methylgroepen — bepaalt een cel dynamisch welke genen worden ‘gelezen’ en wanneer. Geen centrale processor. Geen besturingssysteem. Geen cloud. Het is alsof elke cel haar eigen slimme, zelfregulerende dataserver is.

We zien hier een fascinerende analogie: zoals AI nog ver verwijderd is van menselijke intuïtie, creativiteit en contextbegrip, zo blijven onze opslagtechnologieën ver achter bij de elegantie en efficiëntie van biologische opslag. Wij bouwen datacenters van duizenden vierkante meters en honderden megawatt. De natuur doet hetzelfde in een eicel van 0,1 millimeter.

De Toekomst: DNA als Archiefdrager

Onderzoekers bouwen inmiddels prototypes van DNA-gebaseerde archieven. Microsoft Research slaagde erin om video’s, tekst en muziek te coderen in synthetisch DNA. Start-ups ontwikkelen DNA-kopieerapparaten als alternatief voor magneetband. In biohackinglabs worden zelfs logische bewerkingen met DNA getest: DNA-computing in plaats van elektronica.

Toch staan we pas aan het begin. Synthese is duur. Lezen vereist complexe sequencing. Opslagsnelheden zijn traag. Maar de richting is duidelijk: een technologische ontdekkingstocht waarin de natuur al miljarden jaren voorloopt.

Slimme Data: Van Dode Informatie naar Levend Archief

Veel van onze opgeslagen data is ‘dom’: platte teksten, statische beelden, simpele datasets. Metadata geeft wel wat extra context, maar data-objecten kunnen nog niet zelfstandig waarde creëren. Zelfs met AI-agents ontbreekt het vaak aan begrip van relaties, relevantie en context.

Maar stel dat we metadata verrijken met betekenis: context, semantiek, doelgerichtheid. Dan kunnen informatie-objecten — met hulp van AI-agents en microservices — zelfstandig waarde opbouwen door verwante informatie te verzamelen en te combineren. Van passieve archieven naar actieve kennisnetwerken.

Een Lessenboek van de Natuur

Zoals onze hersenen herinneringen koppelen en associatief denken — zo zouden ook onze data-architecturen kunnen werken. Informatie die niet alleen vindbaar is, maar zichzelf organiseert en verbindt. Dan wordt opslag geen eindstation, maar een bron voor creativiteit, begrip en innovatie.

De natuur laat ons zien hoe het kan. Veerkrachtig, energiezuinig, zelforganiserend. Misschien is het tijd dat we — in plaats van de natuur te imiteren — eerst leren begrijpen hoe zij al miljarden jaren met data omgaat. En pas daarna, met gepaste nederigheid, proberen te bouwen wat zij allang beheerst.

Door: Hans Timmerman (foto)

Veeam 10/06/2025 t/m 01/07/2025 BN + BW DIC Security Day BW tm 1 juli 2025
Gartner BN tm 12-11-2025 - 4