'Uitbreidingen van AI-agents kunnen risico's met zich meebrengen'
Unit 42, het onderzoeksteam van cybersecuritybedrijf Palo Alto Networks, waarschuwt dat uitbreidingen voor AI-agents steeds vaker afwijken van hun beschrijving. Uit een analyse van bijna 50.000 AI-uitbreidingen bleek dat 80% minstens één verschil vertoonde tussen de beloofde functionaliteit en het daadwerkelijke gedrag. In totaal werden meer dan 250.000 afwijkingen geïdentificeerd.
Om deze risico’s te beperken, heeft Unit 42 de methode Behavioral Integrity Verification (BIV) ontwikkeld. Deze methode controleert AI-uitbreidingen vooraf, voordat ze toegang krijgen tot bedrijfsdata en systemen. Organisaties gebruiken AI-agents steeds vaker voor taken zoals klantenservice en IT-beheer, waarbij externe uitbreidingen – vergelijkbaar met apps op een smartphone – extra functionaliteit bieden. Eenmaal geïnstalleerd kunnen deze uitbreidingen toegang krijgen tot bestanden, gevoelige data, externe diensten en systeemcommando’s.
Vaak combinatie van stappen
Uit het onderzoek komt naar voren dat het gevaar vaak niet in één handeling zit, maar in een combinatie van stappen die samen een aanval mogelijk maken. Twee aanvalspatronen kwamen het meest voor: het stelen en wegsluizen van gevoelige data en het manipuleren van een AI-agent om alsnog data prijs te geven. Deze patronen waren samen verantwoordelijk voor 88% van alle geconstateerde meerstaps-aanvalsketens. Van de onderzochte afwijkingen bleek 81% het gevolg van fouten of onvolledigheden in de documentatie, terwijl bijna 19% wees op mogelijk kwaadaardige of verdachte activiteit. Op skillniveau troffen de onderzoekers ruim 2.400 uitbreidingen aan met meerstaps-aanvalspatronen die extra aandacht vereisten.
BIV analyseert drie onderdelen van een uitbreiding: de metadata, de onderliggende code en de natuurlijke taal-instructies die het gedrag van een AI-agent bepalen. Door niet alleen naar afzonderlijke functies te kijken, maar ook naar de samenhang daartussen, kunnen complexe aanvalsketens worden herkend die door traditionele beveiligingscontroles vaak over het hoofd worden gezien.
Unit 42 adviseert organisaties om third-party skills vooraf te controleren, nog vóór installatie. Klanten kunnen daarnaast Prisma AIRS en de Unit 42 AI Security Assessment inzetten om hun AI extra te beveiligen.