Anthropic lanceert Claude Sonnet 4.6
Anthropic heeft Claude Sonnet 4.6 gepresenteerd, de nieuwste upgrade van zijn populaire AI-model. De nieuwe versie markeert een enorme stap voorwaarts in 'computer use' (het zelfstandig bedienen van een pc), programmeervaardigheden en strategisch plannen. Voor het eerst biedt het model in beta een contextvenster van maar liefst 1 miljoen tokens.
Met de release van Sonnet 4.6 lijkt Anthropic de grens tussen zijn 'middenklasse' (Sonnet) en 'topklasse' (Opus) modellen te laten vervagen. Gebruikers geven in vroege tests zelfs de voorkeur aan de nieuwe Sonnet boven het krachtigste model van eind vorig jaar, Claude Opus 4.5.
AI die de computer bedient als een mens
Een van de meest opvallende eigenschappen van Sonnet 4.6 is de verbeterde vaardigheid in het aansturen van software. Waar AI voorheen afhankelijk was van specifieke koppelingen (API’s), kan Claude nu een computer gebruiken zoals een mens dat doet: door naar het scherm te kijken, een virtuele muis te bewegen en te typen.
OSWorld-score: Op de OSWorld-benchmark, die taken test in software zoals Chrome en VS Code, laat Sonnet 4.6 een spectaculaire groei zien.
Complexe taken: Het model kan nu zelfstandig door complexe spreadsheets navigeren en formulieren invullen die over meerdere browsertabs verspreid zijn.
Veiligheid: Anthropic benadrukt dat het model aanzienlijk beter bestand is tegen 'prompt injection'-aanvallen (waarbij kwaadwillenden via teksten op websites de AI proberen te kapen).
Superieur in coderen en strategie
Ontwikkelaars die toegang hadden tot de vroege versie rapporteren dat Sonnet 4.6 veel minder "lui" is dan zijn voorgangers. In 70% van de gevallen verkiezen programmeurs dit model boven Sonnet 4.5. Het model is beter in het begrijpen van de volledige context van een codebase en voorkomt het dupliceren van code.
Ook op strategisch vlak verrast het model. In de Vending-Bench Arena, een simulatie waarin AI-modellen een bedrijf runnen, ontwikkelde Sonnet 4.6 een menselijke strategie: het investeerde de eerste tien maanden zwaar in capaciteit om pas in de laatste fase agressief op winst te sturen—een tactiek waarmee het de concurrentie ruim versloeg.
Nieuwe functies en beschikbaarheid
Naast de intelligentie zijn er diverse productverbeteringen doorgevoerd:
1M Context Window: Gebruikers kunnen nu volledige codebases of tientallen onderzoeksrapporten in één keer uploaden.
Context Compaction: Een nieuwe beta-functie vat oudere delen van een gesprek automatisch samen om tokens te besparen zonder de draad kwijt te raken.
Claude in Excel: De add-in ondersteunt nu MCP-connectoren, waardoor Claude data kan ophalen uit externe bronnen zoals Moody’s en FactSet zonder Excel te verlaten.
Direct beschikbaar
Claude Sonnet 4.6 is het standaardmodel voor alle gebruikers van de Free en Pro-abonnementen op claude.ai. De prijzen voor ontwikkelaars via de API blijven gelijk aan die van de vorige versie (Sonnet 4.5).