Witold Kepinski - 01 juni 2026

Anthropic lanceert Zero Trust-raamwerk voor AI-agents

De grens tussen het ontdekken van een softwarekwetsbaarheid en het daadwerkelijke misbruik ervan is door toedoen van geavanceerde AI-modellen gekrompen van maanden naar uren. Nu bedrijven op grote schaal autonome AI-agenten inzetten binnen hun IT-infrastructuur, waarschuwt AI-pionier Anthropic voor een radicaal nieuw dreigingslandschap. Om organisaties te beschermen tegen aanvallen op 'machinesnelheid', heeft het bedrijf een specifiek Zero Trust-beveiligingsraamwerk voor AI-agenten gepresenteerd.

Anthropic lanceert Zero Trust-raamwerk voor AI-agents image

De noodzaak voor een nieuwe beveiligingsaanpak is volgens Anthropic acuut. Frontier AI-modellen zijn vandaag de dag al in staat om ernstige kwetsbaarheden te vinden die traditionele softwaretools en menselijke controleurs jarenlang over het hoofd hebben gezien. Dit versnellingsrisico raakt bedrijven dubbel: hun bestaande IT-omgeving ligt onder vuur door AI-gestuurde aanvallen, en de AI-agenten die zij zélf implementeren introduceren een gevaarlijke mate van autonomie.

De onmacht van traditionele beveiliging

AI-agenten voeren zelfstandig complexe, meerstaps operaties uit, interpreteren doelen en selecteren hun eigen tools. Traditionele toegangscontroles schieten hierbij tekort; ze kunnen niet voorkomen dat een AI-agent zijn legitieme rechten binnen een netwerk per ongeluk of na manipulatie misbruikt. Bovendien moeten monitoring-systemen worden heringericht om aanvallen te detecteren die niet via klassieke hacks verlopen, maar via aanhoudende, subtiele beïnvloeding van de AI.

Het bekende Zero Trust-principe — 'vertrouw niets, verifieer alles en ga ervan uit dat er al een datalek is' — biedt volgens Anthropic het juiste fundament, maar moet drastisch worden aangepast aan de unieke risico's van AI-systemen:

Nieuwe dreigingen: Beveiligingsteams moeten rekening houden met specifieke AI-aanvalstechnieken zoals prompt injection (het kapen van de AI via kwaadaardige instructies), tool poisoning (het manipuleren van de gekoppelde systemen), misbruik van privileges, en het vergiftigen van het langetermijngeheugen van de AI.

Cryptografische identiteit: AI-agenten moeten een eigen, cryptografisch verankerde identiteit krijgen, waarbij de machtigingen en permissies strikt per specifieke deeltaak worden toegekend en direct daarna verlopen.

Zandbakken en filters: Het raamwerk schrijft een strikte implementatie voor in acht fasen, waarin onder meer het isoleren van de AI in afgeschermde omgevingen (sandboxing), strenge invoer- en uitvoercontroles, en het beschermen van het AI-geheugen centraal staan.

Defensie op AI-snelheid: Agentic SOAR

Omdat menselijke security-teams simpelweg te traag zijn om te reageren op AI-gestuurde aanvalsgolven, introduceert het raamwerk het concept van Agentic SOAR (Security Orchestration, Automation, and Response). Dit houdt in dat ook de verdedigingslinie volledig wordt geautomatiseerd met AI-agenten, zodat tegenmaatregelen op exact dezelfde machinesnelheid kunnen worden genomen als de aanval zelf.

Het raamwerk van Anthropic deelt de AI-beveiliging op in drie volwassenheidsniveaus (Basis, Geavanceerd en Geoptimaliseerd), afhankelijk van de risicotolerantie van de organisatie. Daarnaast is de blauwdruk direct afgestemd op de strenge nalevingsrichtlijnen binnen gereguleerde sectoren zoals de gezondheidszorg, de financiële wereld en de overheid.

De boodschap van Anthropic aan de markt is onbarmhartig maar realistisch: de organisaties die de vruchten van autonome AI veilig willen plukken, moeten hun basisbeveiliging zo strak op orde hebben dat AI-scanners überhaupt minder fouten vinden. Bovenal moeten hun AI-systemen vanaf dag één zo zijn ontworpen dat ze standhouden ná een onvermijdelijke inbreuk.

Ingram Micro BW + BN Fundaments Overheid 360 BW + BN
Igel BW en BN