Witold Kepinski - 13 mei 2025

Gartner: Wat is AI-Ready Data en hoe bereikt u het?

AI-Ready data is essentieel om de belofte van AI-initiatieven waar te maken. Gartner-analist Rita Sallam legt uit wat het precies inhoudt en presenteert vijf cruciale stappen om uw data hierop voor te bereiden.

Gartner: Wat is AI-Ready Data en hoe bereikt u het? image

Data- en analyticsleiders staan voor de taak om aan te tonen dat de data van hun organisatie geschikt is voor een steeds groeiend aantal AI-initiatieven. Er bestaan echter significante verschillen tussen de vereisten van AI-Ready data en traditioneel datamanagement aldus Rita Sallam

Om deze kloof te overbruggen, adviseert Gartner de volgende stappen:

  1. Beoordeel uw databehoeften op basis van de AI-use cases.
  2. Presenteer de vereisten aan het bestuur en verkrijg hun steun.
  3. Ontwikkel datamanagementpraktijken.
  4. Breid het datamanagementecosysteem uit.
  5. Schaal en beheer.

Dit stappenplan zorgt ervoor dat uw data gereed is voor de specifieke AI-initiatieven die u nastreeft en houdt stakeholders op één lijn over wat het werkelijk betekent voor data om AI-Ready te zijn.

Wat betekent het als data AI-Ready is?

U kunt aantonen dat uw data voldoet aan de AI-vereisten door data af te stemmen op use cases, deze te kwalificeren en passende governance aan te tonen. De volgende drie vragen kunnen hierbij helpen:

Sluit de data van onze organisatie aan bij de vereisten van de use case?

Elke AI-use case moet beschrijven welke data nodig is, wat ook afhangt van de gebruikte AI-techniek. Dit is mogelijk niet direct volledig gedefinieerd, maar zal zich ontwikkelen naarmate de data wordt gebruikt en aan de AI-vereisten wordt voldaan. Denk hierbij aan vereisten zoals:

  • AI-technieken: Verschillende AI-technieken, zoals generatieve AI (GenAI) of simulatiemodellen, hebben unieke datavereisten.
  • Kwantificering: Zorg voor een voldoende datavolume, rekening houdend met patronen zoals seizoensinvloeden.
  • Semantiek en labeling: Correcte annotatie en labeling, met name voor afbeeldingen en video's, zijn cruciaal.
  • Kwaliteit: Data moet voldoen aan kwaliteitsstandaarden die specifiek zijn voor de AI-use case, zelfs als deze fouten of uitschieters bevat.
  • Betrouwbaarheid: Databronnen en -pipelines moeten betrouwbaar zijn.
  • Diversiteit: Neem diverse databronnen op om bias te voorkomen.
  • Lineage: Behoud transparantie over de herkomst en transformaties van data.

Hoe kwalificeren we datagebruik om te voldoen aan de verwachte betrouwbaarheidseisen van AI?

Het kwalificeren van het gebruik zorgt ervoor dat de data continu voldoet aan de vereisten, of het nu gaat om het trainen, ontwikkelen of operationeel uitvoeren van een model. Gebruik de volgende parameters om ervoor te zorgen dat data voldoet aan de verwachte betrouwbaarheidseisen voor AI-use cases:

  • Validatie en verificatie: Zorg er regelmatig voor dat data voldoet aan de vereisten tijdens ontwikkeling en operationele processen.
  • Performance en kosten: Data moet voldoen aan operationele service level agreements, inclusief responstijd en kostenefficiëntie.
  • Versioning: Volg en beheer verschillende dataversies om modeldrift en pipelineproblemen aan te pakken.
  • Continue regressietests: Ontwikkel testcases om fouten en datadrift te detecteren.
  • Observability metrics: Monitor de datakwaliteit, inclusief tijdige levering en nauwkeurigheid.

Hoe beheren we AI-Ready data in de context van de use case?

Definieer de doorlopende datagovernancevereisten waaraan de data moet voldoen ter ondersteuning van de AI-use case met behulp van parameters zoals:

  • Data stewardship: Pas beleid toe gedurende de gehele datalevenscyclus, inclusief modeltoegang en -ontwikkeling.
  • Standaarden en regelgeving: Voldoe aan evoluerende AI-regelgeving, zoals de AI EU Act en GDPR.
  • AI-ethiek: Pak ethische overwegingen aan, zoals het gebruik van echte klantdata voor training.
  • Gecontroleerde inferentie en afleiding: Volg hoe modellen interageren en waarborg governance.
  • Data bias en eerlijkheid: Beheer data bias proactief en test modellen met adversarial datasets.
  • Data delen: Faciliteer het delen van data en metadata ter ondersteuning van verschillende AI-use cases.

Meer over de belangrijkste fasen van het stappenplan naar AI-Ready data

Op basis van uitgebreide interacties met klanten die succesvolle AI-Ready data-initiatieven hebben geïmplementeerd, beveelt Gartner vijf stappen aan voor D&A-leiders op weg naar AI-readiness:

  1. Beoordeel de readiness van datamanagement: Evalueer de huidige staat van uw datamanagementpraktijken om lacunes en verbeterpunten te identificeren.
  2. Verkrijg steun van het bestuur: Zorg voor steun en afstemming op directieniveau om de benodigde middelen en commitment voor AI-initiatieven te waarborgen.
  3. Ontwikkel datamanagementpraktijken: Pas datamanagementstrategieën aan en verbeter ze om te voldoen aan de specifieke vereisten van AI-Ready data.
  4. Breid het data-ecosysteem uit: Vergroot uw data-infrastructuur en -capaciteiten ter ondersteuning van diverse en schaalbare AI-use cases.
  5. Schaal en beheer: Implementeer robuuste datagovernanceframeworks om datakwaliteit, compliance en ethisch gebruik te waarborgen naarmate uw AI-initiatieven groeien.

Veelgestelde vragen over AI-Ready data

Wat is AI-Ready data?

AI-Ready data betekent dat uw data representatief moet zijn voor de use case, voor elk patroon, fout, uitschieter en onverwachte gebeurtenis die nodig is om een AI-model te trainen of uit te voeren voor een specifieke toepassing. Het is een proces en een praktijk gebaseerd op de beschikbaarheid van metadata om de data af te stemmen, te kwalificeren en te beheren.

Hoe maken we al onze data AI-Ready?

Het is niet mogelijk om data in het algemeen of vooraf AI-Ready te maken. De readiness van data voor AI hangt af van hoe de data zal worden gebruikt. Er zijn bijvoorbeeld zeer verschillende datasets nodig om een algoritme voor voorspellend onderhoud te bouwen versus het toepassen van GenAI op bedrijfsdata.

Als onze data van hoge kwaliteit is, is deze dan automatisch AI-Ready?

"Hoogwaardige" data - beoordeeld volgens traditionele datakwaliteitsstandaarden - is niet hetzelfde als AI-Ready data. Bij het nadenken over data in de context van analytics wordt bijvoorbeeld verwacht dat u uitschieters verwijdert of de data opschoont om te voldoen aan de verwachtingen van mensen. Bij het trainen van een algoritme heeft het algoritme echter representatieve data nodig. Dit kan ook data van mindere kwaliteit omvatten.

Lees meer over Gartner aanbeveligen rond AI Readiness: Get AI Ready — What IT Leaders Need to Know and Do

Forescout 08/05/2025 t/m 16/05/2025 BW DIC Security Day BW tm 1 juli 2025
GITEX Europe Partnership 07/05/2025 t/m 14/05/2025 BN + BW