Claude Sonnet 4.5: De krachtigste AI voor 30+ uur non-stop coderen

2025-09-30
05:47
Claude McKenzie
Laatst bijgewerkt op 2025-11-05

Anthropic heeft zojuist officieel Claude Sonnet 4.5, en de resultaten zijn verbluffend.

Trouwens, als je ChatGPT wilt gebruiken met Tweelingen en andere top AI-modellen tegen een extreem lagere prijs, Wereldwijde GPT biedt een geïntegreerde alles-in-één ervaring.

Probeer Claude Sonnet 4.5 nu ！

Claude Sonnet 4.5 bovenaan het SWE-bench Verified klassement

Op de SWE-bench Geverifieerd test - die de programmeervaardigheid in de echte wereld evalueert - haalde Claude Sonnet 4.5 de #1 plek in de industrie.

Nog gekker? Het kan gefocust blijven en continu werken gedurende meer dan 30 uur achter elkaar.

Ja, AI heeft zojuist nog een voordeel ten opzichte van mensen toegevoegd.

Claude Sonnet 4.5 tops the SWE-bench Verified leaderboard

Ongeëvenaarde codeerkracht: Apps bouwen zoals ademen

Toen we bijvoorbeeld de opdracht kregen om een Slack- of Teams-achtige chat-app te bouwen, kwam er het volgende uit 11.000 regels code in één keer. Ter vergelijking: de oudere Claude Opus 4 en Codex konden slechts ongeveer 7 uur onafgebroken werken.

Volgens Anthropic, Sonnet van Claude 4.5 is nu 's werelds krachtigste coderingsmodel - met enorme verbeteringen in het bouwen van complexe agenten, computerbewerkingen, redeneren en wiskunde.

Claude Sonnet 4.5 is now the world’s most powerful coding model

Op OSWorld, een benchmark die is ontworpen om echte computertaken te testen, scoorde het 61.4%, opnieuw de eerste plaats. Nog maar vier maanden geleden voerde Sonnet 4 de lijst aan met 42,2% - de sprong in prestatie is dus verbluffend.

Claude Sonnet 4.5 achieving 61.4% on the OSWorld benchmark for real computer tasks

Nieuwe functies en gereedschapsupgrades van Claude Sonnet 4.5

Anthropic heeft naast het nieuwe model ook een aantal belangrijke upgrades doorgevoerd:

Ondersteuning voor controlepunten is eindelijk beschikbaar, waardoor de voortgang kan worden opgeslagen en op elk moment kan worden teruggekeerd naar eerdere toestanden.
Informatie over gebruik kan nu rechtstreeks worden opgevraagd binnen Claude Code met behulp van /gebruik.
Inheemse VS-code-plugin beschikbaar is, vergelijkbaar met OpenAI's Codex plugin.
Code SDK is officieel omgedoopt tot Claude Agent SDK, het verbeteren van de capaciteiten van agenten.
Terminalinterface is aanzienlijk vernieuwd, waardoor gebruikers bij het opstarten in één oogopslag de geschiedenis van eerdere sessies en lijsten met nieuwe functies kunnen zien.

New Features and Tool Upgrades of Claude Sonnet 4.5

Anthropic heeft zelfs de onderliggende infrastructuur die ze gebruiken om Claude Code te bouwen, genaamd de Claude Agent SDK.

Het beheren van geheugen voor agenten tijdens langlopende taken, het ontwerpen van toestemmingssystemen die een balans vinden tussen autonomie en gebruikerscontrole, en het coördineren van meerdere sub-agenten om doelen te bereiken zijn allemaal uitdagende aspecten van het bouwen en ontwerpen van AI-agenten.

Met de Claude Agent SDK, Je kunt deze infrastructuur nu gebruiken om je eigen producten te bouwen.

Vroege reacties van gebruikers: Een haat-liefdeverhouding

Vanaf vandaag kunnen ontwikkelaars bellen met claude-sonnet-4-5 via de Claude API. De prijs is ongewijzigd ten opzichte van Sonnet 4: $3/$15 per miljoen tokens.

Vroege testers zijn al onder de indruk:

Een ontwikkelaar deelde zijn ervaring direct nadat hij het had geprobeerd:

“Claude 4.5 Sonnet heeft zojuist mijn hele codebase in één keer gerefactored: 25 toolaanroepen, meer dan 3000 nieuwe regels code en 12 gloednieuwe bestanden. Het modulariseerde alles, brak de monolithische structuur af en ruimde spaghetti-code op. Het resultaat draaide niet echt, maar wow, het was echt elegant.” Deze recensie voelt als een mix van liefde en frustratie.

Cursor verklaarde dat ze met Claude Sonnet 4.5 vooruitstrevende programmeerprestaties hebben waargenomen, vooral met verbeteringen in de verwerking van langdurige taken. Dit verklaart waarom veel Cursor gebruikers Claude kiezen om de meest complexe problemen aan te pakken.

De bekende recensent tech blogger Dan Shipper merkte op dat Claude 4.5 aanvoelt als sneller, beter controleerbaar en stabieler.

Verbeterde veiligheid: Hoogste uitlijning tot nu toe

Prestaties zijn één ding, maar veiligheid moet gelijke tred houden.

Claude Sonnet 4.5 is volgens Anthropic hun meest uitgelijnde geavanceerde model tot nu toe.

Dankzij de verbeterde mogelijkheden van Claude in combinatie met rigoureuze veiligheidstrainingen, heeft Anthropic significante verbeteringen aangebracht in het gedrag van het model, waardoor neigingen zoals vleierij, misleiding, machtsbeluste houding en het aanmoedigen van waanideeën afnemen. Daarnaast heeft Anthropic belangrijke doorbraken bereikt in de verdediging tegen prompt injection aanvallen en het minimaliseren van verkeerde classificatie van inhoud.

Claude Sonnet 4.5 Experimentele functie: Stel je voor met Claude

Tegelijkertijd lanceerde Anthropic een tijdelijk onderzoek preview genaamd Stel je voor met Claude. In deze modus genereert Claude software in realtime - geen enkele functie of code is vooraf geschreven. Alles wordt ter plekke interactief gemaakt en aangepast.

Deze preview is alleen beschikbaar voor Claude Max abonnees de komende 5 dagen.

Toegang hier：https://claude.ai/imagine/

Claude Sonnet 4.5 Experimental Feature: “Imagine with Claude”

Marktconcurrentie en strategische betekenis van Claude Sonnet 4.5

Anthropic wordt momenteel gewaardeerd op $183 miljard, met een jaarlijkse omzet van $5 miljard in augustus - waarvan een groot deel wordt gevoed door codeertools. Maar de concurrentie is hevig: OpenAI en Google Gemini zijn ook in een race om de markt voor ontwikkelaars te domineren.

De jaarlijkse ontwikkelaarsconferentie van OpenAI is over een week. Anthropic Claude 4.5 nu laten vallen is een duidelijke zet om druk uit te oefenen.

Anthropic's medeoprichter en hoofdwetenschapper Jared Kaplan heeft al laten doorschemeren dat een nog geavanceerdere Claude Opus model wordt later dit jaar gelanceerd.

Problemen uit het verleden en herstel van het vertrouwen van de gebruiker

Het is niet allemaal van een leien dakje gegaan. In de afgelopen twee maanden beschuldigden gebruikers de Claude-reeks ervan “dommer” te zijn geworden. Velen meldden scherpe dalingen in de kwaliteit van redeneringen, codering, opmaak en het gebruik van gereedschappen - zelfs betaalde Max-abonnees.

Anthropic heeft twee onafhankelijke bugs toegegeven en de Opus 4.1 update teruggedraaid, waarbij kostenbesparende motieven werden ontkend. Maar zonder compensatie of terugbetalingen, verspreidde het verzet zich op GitHub en X, waarbij sommige gebruikers overstapten naar concurrenten zoals Codex.

De release van Claude Sonnet 4.5 is Anthropic's kans om ze terug te winnen. Of dat lukt, zal afhangen van hoe het model de komende weken in de praktijk zal presteren.

Deel de post: