Witold Kepinski - 13 mei 2025

Gartner analist Markt Beyer benadrukt het belang van AI-Ready Data

Tijdens een recente presentatie tijdens de Gartner Data & Analytics Summit 2025 in Londen heeft Gartner analist Markt Beyer (foto) de cruciale rol van "AI-Ready Data" benadrukt voor organisaties die ambitieuze doelstellingen op het gebied van kunstmatige intelligentie (AI) nastreven. Beyer ging dieper in op de definitie van AI-Ready Data, de huidige aanpak van zowel klanten als leveranciers, en de aanbevelingen van Gartner om dit te realiseren.

Gartner analist Markt Beyer benadrukt het belang van AI-Ready Data image

Een veelvoorkomende misvatting is dat AI-initiatieven per se "already data" vereisen, oftewel data die direct en perfect geschikt is voor AI-modellen. Beyer nuanceerde dit beeld: "Veel van uw data scientists en data engineers zijn heel goed in staat om zelfs de meest complexe data te transformeren, anomalieën te corrigeren en het verschil te begrijpen tussen een fout, een uitschieter en een opkomende dataset." Hij benadrukte echter dat deze expertise nodig is om de data voor te bereiden, wat een significante inspanning kan vergen als de data niet "ready" is.

Een ander belangrijk punt dat Beyer aanstipte, is dat hoge datakwaliteit geen absolute vereiste is voor AI-readiness. Datakwaliteit is contextueel bepaald. Data die 100% gekwalificeerd is voor een operationeel systeem, proces of applicatie, is niet automatisch van dezelfde kwaliteit voor een AI-toepassing. Beyer illustreerde dit met voorbeelden van intentioneel spaarzame data en de creatie van proxies zoals tax-ID's, die hun waarde verliezen buiten de context waarvoor ze zijn ontworpen.

Master Data

Ook de stelling dat master data automatisch AI-ready is, werd door Beyer ontkracht. Hij wees erop dat centrale governance van data, zoals GPS-data beheerd door het Royal Observatory in Greenwich, niet betekent dat de interpretatie en het gebruik van die data binnen een organisatie automatisch gestandaardiseerd en geschikt is voor diverse AI-toepassingen. Hetzelfde geldt voor concepten als "klant" versus "prospect", die contextafhankelijk zijn.

Beyer presenteerde een overzicht van enkele cruciale aspecten voor AI-Ready Data:

Aligned Data: Het is essentieel om te begrijpen of data is afgestemd op meerdere use cases en om inzicht te hebben in al deze use cases.

Continuously Qualified Data: Datakwaliteit is niet statisch; data verschuift en er ontstaan afwijkingen. Daarom is continue kwalificatie en monitoring van data essentieel.

Contextually Based Governance: Governance is niet universeel, maar afhankelijk van de context waarin de data wordt gebruikt.

Om de complexiteit te vereenvoudigen, presenteerde Beyer een "heat map" die de geschiktheid van verschillende AI-technieken voor diverse oplossingen illustreerde. Dit benadrukte dat niet elke AI-techniek dezelfde data-eisen heeft. De keuze van de AI-techniek beïnvloedt de vereisten op het gebied van datakwaliteit en data-relaties.

Data Management

Beyer vergeleek traditioneel data management, gekenmerkt door drempelwaarden en waterlijnen, met AI-Ready datamanagement. Bij AI draait het niet alleen om historische succesvolle data-analyse, maar ook om de inertie van data: is de data succesvol gebruikt met vergelijkbare AI-technieken in verschillende use cases? Daarnaast introduceerde hij het checksum-model, waarbij data continu wordt gecontroleerd aan de hand van de vereisten van het AI-model, zoals vastgelegd in zogenaamde "AI model cards".

Tot slot presenteerde Beyer een lijst met concrete aanbevelingen voor het realiseren van AI-Ready Data en introduceerde hij enkele "AI-Ready Data Modes":

POC (Proof of Concept): Data wordt ad-hoc gebruikt met eigen kwalificatie en metadata.

Multi-context: Hetzelfde data wordt in meerdere contexten gebruikt, waardoor metadata begint te overlappen.

Operationalizing: Systemen worden gebouwd om data te delen en te gebruiken in meerdere AI-modellen.

Production: Geautomatiseerde processen en scripting worden ingezet voor dataverwerking en modeluitvoering, met steeds rijkere metadata.

Metadata

Beyer sloot af met het benadrukken van het belang van een strategische prioriteit voor AI-Ready Data, het continu evolueren van de bijbehorende processen en het leren en uitbreiden van AI-use cases door optimaal gebruik te maken van metadata.

Lees ook het Gartner artikel: What Is AI-Ready Data? And How to Get Yours There.

DIC Security Day BW tm 1 juli 2025 Forescout 08/05/2025 t/m 16/05/2025 BW
Gartner BN tm 12-11-2025 - 4