AWS vereenvoudigt model voor efficiëntere AI-Agents
De uitdaging van efficiëntie is uitgegroeid tot een kritiek obstakel voor organisaties die AI op grote schaal inzetten zo meldt AWS op zijn re;Invent 2025 conferentie in Las Vegas. Hoewel het bouwen van AI-applicaties eenvoudiger is geworden, blijft het runnen ervan op schaal duur en resource-intensief. Dit probleem is met name nijpend voor AI-agents, die hogere inferentie-eisen stellen omdat ze redeneren, diverse tools inzetten en coördineren tussen meerdere systemen. Veel bedrijven kiezen ervoor om hun agents aan te drijven met de grootste, meest capabele modellen, maar een aanzienlijk deel van de tijd van een agent wordt besteed aan routinematige taken – zoals het controleren van agenda’s en het doorzoeken van documenten – die geen geavanceerde intelligentie vereisen. Het gevolg: onnodige kosten, tragere reacties en verspilde middelen.
De oplossing ligt volgens AWS in modelaanpassing: het aanpassen van kleinere, gespecialiseerde modellen om het werk af te handelen dat agents het vaakst uitvoeren. Dit resulteert in snellere, nauwkeurigere reacties tegen lagere kosten. Tot voor kort vereisten geavanceerde aanpassingstechnieken, zoals Reinforcement Learning (bekrachtigend leren), echter diepgaande machine learning-expertise, uitgebreide infrastructuur en maanden aan ontwikkelingstijd.
Tijdens AWS re:Invent werden nieuwe functionaliteiten in Amazon Bedrock en Amazon SageMaker AI aangekondigd die geavanceerde modelaanpassing toegankelijk maken voor ontwikkelaars in elke organisatie. Reinforcement Fine Tuning (RFT) in Amazon Bedrock en serverloze modelaanpassing in Amazon SageMaker AI vereenvoudigen het proces voor het creëren van efficiënte AI die snel, kosteneffectief en nauwkeuriger is dan de basismodellen. Door deze technieken toegankelijker te maken, wordt het eenvoudiger voor organisaties van elke omvang om aangepaste agents te bouwen voor elke zakelijke behoefte.
Amazon Bedrock
Moeilijke aanpassingstechnieken vormden tot nu toe een hindernis voor het bouwen van aangepaste, efficiënte modellen. Reinforcement Learning traint een model bijvoorbeeld met behulp van feedback van mensen of een ander model: goed gedrag wordt bekrachtigd en slecht gedrag wordt gecorrigeerd. Dit is bijzonder geschikt voor redenering en complexe workflows omdat het goede processen beloont, niet alleen de juiste antwoorden. Het vereist echter een complexe trainingspijplijn, enorme rekenkracht en toegang tot dure menselijke feedback of een krachtig AI-model om elke reactie te evalueren.
RFT op Amazon Bedrock vereenvoudigt dit proces en opent de techniek voor elke ontwikkelaar. Amazon Bedrock, een volledig beheerd AI-platform, geeft klanten toegang tot hoogwaardige foundation models van toonaangevende AI-bedrijven. RFT op Amazon Bedrock levert een gemiddelde nauwkeurigheidswinst van 66% ten opzichte van basismodellen. Dit helpt organisaties betere resultaten te behalen met kleinere, snellere en kosteneffectievere modellen, in plaats van te vertrouwen op grotere, duurdere varianten.
Het proces is eenvoudig. Ontwikkelaars selecteren hun basismodel, wijzen naar hun invocation logs (de geschiedenis van de AI) of uploaden een dataset. Vervolgens kiezen ze een beloningsfunctie — AI-gebaseerd, op regels gebaseerd, of een kant-en-klare sjabloon. Geautomatiseerde workflows in Amazon Bedrock regelen het fine-tuning-proces van begin tot eind. Er is geen PhD in machine learning vereist; enkel een duidelijk inzicht in hoe goede bedrijfsresultaten eruitzien. Bij de lancering ondersteunt RFT in Amazon Bedrock het Amazon Nova 2 Lite-model, met compatibiliteit met andere modellen die binnenkort volgt.
Klanten zoals Salesforce en Weni by VTEX hebben al een hogere nauwkeurigheid en efficiëntie waargenomen door RFT in Amazon Bedrock te gebruiken. Phil Mui, SVP of Software Engineering, Agentforce bij Salesforce, merkte op dat de RFT-benchmarking van AWS een verbetering van tot wel 73% in nauwkeurigheid liet zien voor hun specifieke zakelijke vereisten, waardoor ze nog preciezere en aangepaste AI-oplossingen kunnen leveren.
Amazon SageMaker AI
Teams die meer controle over de AI-workflow nodig hebben, kunnen zich richten op Amazon SageMaker AI. AI-ontwikkelaars kiezen voor SageMaker AI vanwege de volledige controle over het bouwen, trainen en implementeren van de meest capabele modellen op schaal.
Hoewel SageMaker AI sinds de lancering in 2017 de AI-ontwikkelworkflow sneller heeft gemaakt, willen organisaties nu geavanceerdere aanpassingstechnieken gebruiken met nog naadlozer ervaringen. Ze willen belemmeringen wegnemen die maanden werk kosten – zoals infrastructuurbeheer en het genereren van synthetische data – om zich te kunnen concentreren op het ontwikkelen van betere resultaten voor klanten. Daarom ondersteunt SageMaker AI nu nieuwe serverloze modelaanpassingsmogelijkheden, waardoor het aanpassen van modellen in slechts enkele dagen mogelijk wordt.
Ontwikkelaars kunnen kiezen uit twee ervaringen:
- Een Agentic Experience (Preview): Een AI-agent begeleidt ontwikkelaars door het hele modelaanpassingsproces, van het genereren van synthetische data tot de uiteindelijke evaluatie. Ontwikkelaars beschrijven in natuurlijke taal wat ze nodig hebben.
- Een zelfgestuurde aanpak: Voor degenen die gedetailleerde controle willen. Deze optie elimineert infrastructuurbeheer terwijl het de juiste hulpmiddelen biedt om een aanpassingstechniek te selecteren en parameters aan te passen.
Met beide opties krijgen ontwikkelaars toegang tot geavanceerde aanpassingstechnieken zoals Reinforcement Learning from AI feedback, Reinforcement Learning with Verifiable Rewards, Supervised Fine-Tuning en Direct Preference Optimization. De nieuwe SageMaker AI-mogelijkheden werken met Amazon Nova en populaire openbare modellen zoals Llama, Qwen, DeepSeek en GPT-OSS.
Klanten zoals Collinear AI hebben al weken bespaard door SageMaker AI's nieuwe serverloze aanpassingsmogelijkheden te gebruiken. Soumyadeep Bakshi, medeoprichter van Collinear AI, merkte op dat hun experimentatiecycli van weken naar dagen zijn teruggebracht. Deze end-to-end serverloze tooling stelt hen in staat om zich te richten op "het bouwen van betere trainingsdata en simulaties voor onze klanten, en niet op het onderhouden van infrastructuur of het jongleren met ongelijksoortige platforms."
AWS positioneert deze nieuwe tools als de sleutel tot het democratiseren van geavanceerde AI, waardoor ontwikkelaars in elke organisatie de middelen krijgen om efficiëntere, kosteneffectievere AI-agents te bouwen die de bedrijfsresultaten direct beïnvloeden.