Anthropic hat gerade offiziell veröffentlicht Claude Sonett 4.5, und die Ergebnisse sind verblüffend.
Übrigens, wenn Sie ChatGPT verwenden möchten mit Zwillinge und andere Top-KI-Modelle zu einem extrem niedrigen Preis, Globale GPT bietet ein integriertes All-in-One-Erlebnis.

Claude Sonnet 4.5 führt die SWE-bench Verified-Rangliste an
Auf der SWE-Bank Geprüft Test - der die Programmierfähigkeiten in der Praxis bewertet - hat Claude Sonnet 4.5 den #1-Spot in der Industrie.
Noch verrückter? Es kann konzentriert bleiben und kontinuierlich arbeiten für über 30 Stunden am Stück.
Ja, die KI hat gerade einen weiteren Vorteil gegenüber dem Menschen hinzugefügt.

Unerreichte Coding-Power: Apps bauen wie Atmen
Als wir zum Beispiel mit der Entwicklung einer Slack- oder Teams-ähnlichen Chat-App beauftragt wurden, produzierte es 11.000 Zeilen Code in einer Sitzung. Im Vergleich dazu konnten die älteren Claude Opus 4 und Codex nur etwa 7 Stunden durchgängig arbeiten.
Laut Anthropic, Claude Sonett 4.5 ist jetzt das leistungsfähigste Codierungsmodell der Welt - mit massiven Verbesserungen beim Aufbau komplexer Agenten, bei Computeroperationen, beim logischen Denken und in der Mathematik.

Auf OSWorld, einem Benchmark, mit dem reale Computeraufgaben getestet werden, erzielte er 61.4%, erneut den ersten Platz. Noch vor vier Monaten lag Sonnet 4 mit 42,2% an der Spitze - der Leistungssprung ist also atemberaubend.

Neue Funktionen und Tool-Upgrades von Claude Sonett 4.5
Neben dem neuen Modell hat Anthropic auch mehrere wichtige Verbesserungen eingeführt:
- Checkpoint-Unterstützung ist endlich verfügbar und ermöglicht es, den Fortschritt zu speichern und jederzeit zum vorherigen Zustand zurückzukehren.
- Informationen zur Verwendung kann nun direkt in Claude Code abgefragt werden, indem
/Verwendung. - Natives VS-Code-Plugin zur Verfügung, ähnlich wie das Codex-Plugin von OpenAI.
- Claude Code SDK wurde offiziell umbenannt in Claude Agent SDK, die Verbesserung der Fähigkeiten der Agentenbildung.
- Terminal-Schnittstelle wurde grundlegend umgestaltet, so dass die Benutzer beim Start den Verlauf früherer Sitzungen und die Listen neuer Funktionen auf einen Blick sehen können.

Anthropic hat sogar die zugrundeliegende Infrastruktur, die sie zur Erstellung von Claude Code verwenden, die so genannte Claude Agent SDK.
Die Verwaltung des Speichers für Agenten bei lang laufenden Aufgaben, die Entwicklung von Berechtigungssystemen, die ein Gleichgewicht zwischen Autonomie und Benutzerkontrolle herstellen, und die Koordinierung mehrerer Unteragenten zur Erreichung von Zielen sind allesamt herausfordernde Aspekte bei der Entwicklung und dem Entwurf von KI-Agenten.
Mit dem Claude Agent SDK, können Sie diese Infrastruktur nun nutzen, um Ihre eigenen Produkte zu entwickeln.
Frühe Nutzerreaktionen: Eine Hassliebe
Ab heute können Entwickler die claude-sonnet-4-5 über die Claude-API. Die Preisgestaltung ist gegenüber Sonnet 4 unverändert: $3/$15 pro Million Token.
Die ersten Tester sind bereits beeindruckt:
Ein Entwickler teilte seine Erfahrungen unmittelbar nach dem Ausprobieren mit:
“Claude 4.5 Sonnet hat gerade meine gesamte Codebasis in einem einzigen Durchgang umstrukturiert - 25 Toolaufrufe, über 3.000 neue Codezeilen und 12 brandneue Dateien. Es hat alles modularisiert, die monolithische Struktur aufgebrochen und den Spaghetti-Code bereinigt. Das Ergebnis lief zwar nicht wirklich, aber wow, es war wirklich elegant.” Diese Rezension fühlt sich an wie eine Mischung aus Liebe und Frustration.
Cursor gab an, dass sie mit Claude Sonnet 4.5 eine bahnbrechende Programmierleistung beobachten konnten, insbesondere Verbesserungen bei der Handhabung von Aufgaben mit langer Laufzeit. Dies erklärt auch, warum viele Cursor-Benutzer Claude wählen, um die komplexesten Probleme zu bewältigen.
Der bekannte Tech-Blogger Dan Shipper stellte fest, dass sich Claude 4.5 schneller, kontrollierbarer und stabiler.

Erhöhte Sicherheit: Die bisher beste Ausrichtung
Leistung ist eine Sache, aber die Sicherheit muss Schritt halten.
Claude Sonnet 4.5 ist nach Angaben von Anthropic ihr bisher am besten abgestimmtes Spitzenmodell.
Dank der erweiterten Fähigkeiten von Claude in Verbindung mit einem strengen Sicherheitstraining hat Anthropic das Verhalten der Modelle erheblich verbessert und Tendenzen wie Kriecherei, Täuschung, Machtstreben und die Förderung von Wahnvorstellungen verringert. Darüber hinaus hat Anthropic bedeutende Durchbrüche bei der Abwehr von Prompt-Injection-Angriffen und der Minimierung von Fehlklassifizierungen von Inhalten erzielt.

Claude Sonnet 4.5 Experimentelle Funktion: Vorstellen mit Claude
Gleichzeitig startete Anthropic eine temporäre Forschungsvorschau genannt. Vorstellen mit Claude. In diesem Modus generiert Claude Software in Echtzeit - keine der Funktionen oder der Code sind bereits geschrieben. Alles wird an Ort und Stelle interaktiv erstellt und angepasst.
Diese Vorschau ist nur verfügbar für Claude Max Abonnenten in den nächsten 5 Tagen.
Zugang hier:https://claude.ai/imagine/

Marktwettbewerb und strategische Bedeutung von Claude Sonnet 4.5
Der Wert von Anthropic liegt derzeit bei $183 Milliarden, mit einem Jahresumsatz von $5 Mrd. (Stand: August) - ein großer Teil davon entfällt auf Codierungstools. Doch der Wettbewerb ist hart: OpenAI und Google Gemini sind ebenfalls im Rennen um die Vorherrschaft auf dem Entwicklermarkt.
Die jährliche Entwicklerkonferenz von OpenAI ist nur noch eine Woche entfernt. Dass Anthropic Claude 4.5 jetzt fallen lässt, ist ein klarer Schritt, um Druck auszuüben.
Der Mitbegründer und Chefwissenschaftler von Anthropic, Jared Kaplan, hat bereits angedeutet, dass eine noch fortschrittlichere Modell Claude Opus wird noch in diesem Jahr auf den Markt kommen.
Frühere Probleme und Wiederherstellung des Vertrauens der Nutzer
Nicht alles verlief reibungslos. In den letzten zwei Monaten warfen die Nutzer der Claude-Serie vor, sie sei “dumm” geworden. Viele berichteten, dass die Qualität der Argumentation, der Kodierung, der Formatierung und der Verwendung von Werkzeugen stark abgenommen hat - sogar zahlende Max-Abonnenten.
Anthropic räumte zwei unabhängige Fehler ein und nahm das Opus 4.1-Update zurück, wobei es Kosteneinsparungsgründe verneinte. Aber ohne Entschädigung oder Rückerstattung verbreitete sich die Gegenreaktion auf GitHub und X, wobei einige Nutzer zu Konkurrenten wie Codex wechselten.
Die Freigabe von Claude Sonett 4.5 ist die Chance für Anthropic, sie zurückzugewinnen. Ob dies gelingt, wird davon abhängen, wie sich das Modell in den kommenden Wochen in der Praxis bewährt.

