30 maart 2024

Content zonder context heeft weinig waarde

Informatie heeft altijd een bron en reden van ontstaan. Iemand schrijft iets op, een sensor meet een waarde, een kompas wijst een richting aan, een gebeurtenis wordt vastgelegd. Elke informatie heeft altijd context die zowel het ontstaan als gebruik nader inhoud geeft. Contextuele informatie is ‘informatie over de informatie’, net zoals metadata data van de data is. Content is het feitelijke bericht maar context is de achtergrond waarin en waarbinnen dat bericht moet worden geplaatst. Het gebruik van kunstmatige intelligentie maakt context management belangrijker. Voor AI- en ML-modellen is contextuele informatie van cruciaal belang om de juiste antwoorden te kunnen genereren. Contextueel begrip is nodig voor het identificeren van objectrelaties en het ondubbelzinnig maken van semantische betekenissen. Daarom wordt momenteel contextuele informatie steeds belangrijker.

Artificial intelligence Master data management Data Digital

Content zonder context heeft weinig waarde image

Context-aware

Vroeger was de context waarbinnen men systemen gebruikte, sterk bepaald door de fysieke plaats waar de computer stond. Dat veranderde met de komst van de mobiele devices. Hoe kan de mobiliteit voor de gebruiker transparant zijn opdat hij overal automatisch dezelfde dienst kan gebruiken? Transparant in de betekenis dat de gebruiker zich geen zorgen hoeft te maken als er veranderingen in de omgeving optreden. Voor deze transparantie moet het device ‘context aware’ zijn. Bewust van zijn omgeving en het gebruik op dat moment. Denk aan een tablet die bij kanteling de oriëntatie van het scherm verandert, kaarten die zich oriënteren op de huidige lokatie, het zoomniveau aanpassen aan de huidige snelheid of de achtergrondverlichting van de telefoon inschakelen bij gebruik in het donker.

Context verwijst naar de omstandigheden of situatie rond de communicatie die de betekenis of interpretatie beïnvloedt. De inhoud van een gesprek is waar we over praten. De context is waarom we erover praten. Inhoud kan van alles zijn: onze vakantie volgende week, het laatste politieke nieuws, hoe we deze maand onze quota kunnen halen, waarom een voorstel te laat is ingediend, enz. In elk geval is inhoud het ‘wat’ van wat we willen. Waar we het over hebben. Content, de inhoudelijke informatie van een bericht, verwijst naar de daadwerkelijke woorden of informatie die we met de computer eenduidig kunnen registreren, vastleggen en beheren.

Het waarom versus het wat en hoe

Content management is gericht is op het beheer van berichten, documenten, files en tekeningen. De vastlegging van het hoe en wat van een product, een proces of een situatie. Filemanagement en document management bestonden al toen alles nog papier was. Ook archiveren is een vorm van content management: wat moet je bewaren en wat mag je – soms moet je – weggooien. In de jaren tachtig ontstonden de eerste digitale applicaties om documenten te beheren. Als oorspronkelijk papieren dossier of als digitaal object. Een project eind jaren tachtig waarbij we digitaal tekeninginformatie gingen beheren, heette TBE: Tekening Blad Eén. Het digitaliseren van het eerste blad van een set tekeningen waar van oudsher de metadata en de reden van het ontstaan was vermeld. Het waarom, de context van die tekening.

Gekoppeld aan TBE was het project EDC: Engineering Document/Data Control, het beheer van de CAD-modellen waar de inhoud van die tekeningen digitaal was vastgelegd. Het hoe en wat van die set tekeningen. De combinatie van context en content. Metadata en inhoud. TBE legde de context vast: waar en op welke wijze de tekeninginformatie binnen een vliegtuig van belang was. De geldigheid van een onderdeel: voor welke toestellen werd het gebruikt. En omgekeerd de toepassing: waar kon en mocht dat onderdeel of document worden gebruikt. Militair of civiel. Basisonderdeel of klanteneis. Met EDC werd de inhoudelijke ontwerp data (CAD) en productiedata (CAM) vastgelegd die betrekking hadden op die onderdelen of samenstellingen zoals maatvoering, materiaal, bewerking, montage en gebruiksinstructies.

Structuren en lagen

De kern van content management is de mogelijkheid om documenten in onderliggende lagen en structuren te kunnen (blijven) beheren. Bij complexe producten kan zo’n structuur wel tien tot zelfs twintig lagen diep zijn. De uitdaging is om bij veranderingen alle bovenliggende samenstellingen met de juiste versies gekoppeld te houden. Als een enkel onderdeel met de tekening en de bijbehorende beschrijving in een samenstelling verandert, ontstaan al twee verschillende versies van het hoofddocument. Hoe breder en hoe dieper een samenstelling is opgebouwd, hoe complexer het versiebeheer van de documenten wordt. Bij een miljoen onderdelen, wat een groter kapitaalgoed al snel heeft, wordt dat al snel gecompliceerd.

Juist die gecompliceerdheid is digitaal prima te beheren. Immers digitaal grote ‘bomen’ van onderliggende relaties en versies beheren, is wel gecompliceerd maar wel relatief ‘straight forward’. Zeker voor een rechtlijnig denkende computer. In een blog over systeemdenken, beschreef ik al dat iets gecompliceerd kan zijn, zonder dat het complex is. Een recept van een ingewikkeld gerecht kan gecompliceerd zijn, maar als dezelfde stappen worden doorlopen, zal de uitkomst altijd hetzelfde zijn. Dat is bij configuratiemanagement ook: de logica om de onderliggende entiteiten te ordenen en te beheren is helder en eenduidig. Maar wel groot, uitgebreid en daarom voor de mens al snel (te) complex en onoverzichtelijk.

Content Management en de vastlegging van context

In de jaren tachtig werden de eerste content management applicaties ontwikkeld om de groeiende hoeveelheid ‘content’ op ordentelijke manier te ordenen en te beheren. Van eenvoudig filemanagement tot complexe productsamenstellingen. Je heb twee soorten documentbeheer: heel veel, relatief kleine en eenvoudige documenten of juist een beperkt, zeer complexe en ‘diepe’ documenten. Je kunt hier een beetje de tachtig-twintig regel aanhouden. Tachtig procent van alle documenten en files is relatief eenvoudig te beheren, hoewel het er wel heel veel kunnen zijn zoals in administratieve en financiële omgevingen. Twintig procent van de documenten is veel ingewikkelder opgebouwd zoals in engineeringsomgevingen voor complexe producten die vaak ook nog decennialang moeten kunnen worden onderhouden en beheerd.

De laatste tijd komt er een beheersuitdaging bij: het in data-spaces vastleggen van de context die bij de content hoort. In engineeringstoepassingen was de context al vaak relevant en dus beschreven in de productvastlegging. Maar we zien vooral in de ‘eenvoudiger’ administratieve content vastlegging, dat context aanvulling tot uitdagingen leidt. Hoe kun je van grote aantallen relatief kleine entiteiten – eenvoudige files – de groeiende hoeveelheid context toevoegen? Zeker als je met AI-gereedschappen op intelligente wijze van die content en files gebruik wilt gaan maken. Immers, AI-modellen hebben voldoende context nodig om tot de juiste uitkomsten te komen. Juist hier geldt dat content zonder context lastig tot meerwaarde zal leiden. Zeker als je diep en onderling gerelateerd wilt zoeken in die grote aantallen ‘domme’ files. Zeker die context data achteraf toevoegen, is haast onmogelijk.

AI en content management

AI-enabled content management is een interessante nieuwe ontwikkeling. Een belangrijk aspect hierbij is de mogelijkheid van personalisatie van content voor eigen gebruik. Toegang tot content van derden en de orkestratie van die ‘gevonden’ content voor eigen gebruik is een enorme uitdaging. In mijn blog ‘AI als jazzmuzikant’ beschreef ik hoe AI de gebruiker de mogelijkheid geeft te ‘improviseren’ met de content die hij of zij ter beschikking heeft of krijgt. In een andere blog ‘Dematerialisatie: essentie van de metaverse’ gaat over hoe de Metaverse een massaal schaalbaar, interoperabel netwerk is van virtuele real-time werelden die we vanuit de fysieke wereld en de daar aanwezige data moeten beleven. Met ieder een ‘individueel gevoel van aanwezigheid’ zoals identiteit, geschiedenis, rechten, objecten, communicatie en betalingen. De échte uitdaging is dit virtuele leven net zo betrouwbaar, betrouwbaar en veilig te maken als dat in ons fysieke leven is georganiseerd. Waarbij we alle beschikbare data kunnen gebruiken van de wereld waar we op dat moment zijn, fysiek of virtueel. Dat kan alleen als we inhoudelijke data in de op dat moment passende context kunnen plaatsen en gebruiken.

Door: Hans Timmerman (foto)

Tip de redactie