Gartner: 5 stappen naar betere data voor AI
De overgrote meerderheid van de data binnen organisaties – tot wel 90 procent – is 'ongestructureerd'. Het gaat om documenten, video's, chats en audiobestanden die vaak ongebruikt op servers blijven staan. Tijdens de Gartner Data & Analytics Summit 2026 in Londen waarschuwde analist Mark Beyer (foto) dat deze data pas waarde krijgt voor AI als de 'chaos' wordt ingeruild voor een strakke governance-strategie.
"Ongestructureerde data is voor veel bedrijven een onbekende entiteit," stelde Mark Beyer, Distinguished VP Analyst bij Gartner. In zijn sessie legde hij uit dat het ontsluiten van deze informatie cruciaal is voor organisaties die een concurrentievoordeel willen behalen met kunstmatige intelligentie. AI-modellen zijn immers pas echt krachtig als ze toegang hebben tot de specifieke context van een bedrijf, die vaak verscholen zit in pdf’s, e-mails en mediabestanden.
Van rommel naar strategische activa
Het probleem is dat deze data 'rommelig' en moeilijk te gebruiken is. Zonder governance weten bedrijven niet wat ze hebben, of de informatie betrouwbaar is en of deze überhaupt gebruikt mag worden voor AI-training. Beyer benadrukte dat governance de brug is die deze informatie transformeert van een last (opslagkosten en risico’s) naar een kernactiva.
De eerste stap is volgens Gartner niet het installeren van technologie, maar het stellen van prioriteiten. D&A-leiders moeten bronnen identificeren op basis van hun zakelijke waarde en relevantie voor specifieke AI-toepassingen. Niet alles hoeft immers bewaard of ontsloten te worden.
De vijf stappen naar AI-ready data
Om grip te krijgen op de datastroom, presenteerde Beyer een concreet vijfstappenplan voor het beheer van ongestructureerde data:
- Ontdekking en catalogisering: Breng in kaart welke ongestructureerde data er is en waar deze zich bevindt.
- Voorbewerking en analyse: Maak de data klaar voor gebruik door ruis te verwijderen en de kwaliteit te beoordelen.
- Taggen en classificerenay: Voeg metadata en labels toe zodat AI-systemen begrijpen wat de context en betekenis van een bestand is.
- Verbinden en delen: Zorg dat de data toegankelijk is voor de juiste systemen en gebruikers binnen de organisatie.
- Beleid definiëren en uitvoeren: Stel heldere regels op over wie de data mag inzien, hoe lang deze bewaard blijft en voor welke AI-doeleinden deze mag worden ingezet.
Concurrentievoordeel door context
Door deze stappen te volgen, kunnen organisaties hun AI-modellen voeden met unieke, bedrijfseigen informatie. Dit is volgens Gartner precies waar de winst zit. Terwijl iedereen toegang heeft tot publieke AI-modellen, maken juist de eigen documenten en multimedia het verschil in de markt.
"Door ongestructureerde data strategisch te beheren, verander je het van een onbekende factor in een strategisch voordeel," concludeerde Beyer. De boodschap aan de aanwezige IT-leiders in Londen was dan ook duidelijk: wie wil winnen met AI, moet eerst orde op zaken stellen in de eigen digitale archiefkast.