GlobalGPT

Claude Sonnet 4.5: Die leistungsfähigste KI für mehr als 30 Stunden Nonstop-Coding

claude-sonnet-4-5-the-most-powerful-ai-for-30-hours-of-nonstop-coding

Anthropic hat gerade offiziell veröffentlicht Claude Sonett 4.5, und die Ergebnisse sind verblüffend.

Übrigens, wenn Sie ChatGPT verwenden möchten mit Zwillinge und andere Top-KI-Modelle zu einem extrem niedrigen Preis, Globale GPT bietet ein integriertes All-in-One-Erlebnis.

Claude Sonnet 4.5 führt die SWE-bench Verified-Rangliste an

Auf der SWE-Bank Geprüft Test - der die Programmierfähigkeiten in der Praxis bewertet - hat Claude Sonnet 4.5 den #1-Spot in der Industrie.

Noch verrückter? Es kann konzentriert bleiben und kontinuierlich arbeiten für über 30 Stunden am Stück.

Ja, die KI hat gerade einen weiteren Vorteil gegenüber dem Menschen hinzugefügt.

Claude Sonnet 4.5 tops the SWE-bench Verified leaderboard

Unerreichte Coding-Power: Apps bauen wie Atmen

Als wir zum Beispiel mit der Entwicklung einer Slack- oder Teams-ähnlichen Chat-App beauftragt wurden, produzierte es 11.000 Zeilen Code in einer Sitzung. Im Vergleich dazu konnten die älteren Claude Opus 4 und Codex nur etwa 7 Stunden durchgängig arbeiten.

Laut Anthropic, Claude Sonett 4.5 ist jetzt das leistungsfähigste Codierungsmodell der Welt - mit massiven Verbesserungen beim Aufbau komplexer Agenten, bei Computeroperationen, beim logischen Denken und in der Mathematik.

 Claude Sonnet 4.5 is now the world’s most powerful coding model

Auf OSWorld, einem Benchmark, mit dem reale Computeraufgaben getestet werden, erzielte er 61.4%, erneut den ersten Platz. Noch vor vier Monaten lag Sonnet 4 mit 42,2% an der Spitze - der Leistungssprung ist also atemberaubend.

Claude Sonnet 4.5 achieving 61.4% on the OSWorld benchmark for real computer tasks

Neue Funktionen und Tool-Upgrades von Claude Sonett 4.5

Neben dem neuen Modell hat Anthropic auch mehrere wichtige Verbesserungen eingeführt:

  • Checkpoint-Unterstützung ist endlich verfügbar und ermöglicht es, den Fortschritt zu speichern und jederzeit zum vorherigen Zustand zurückzukehren.
  • Informationen zur Verwendung kann nun direkt in Claude Code abgefragt werden, indem /Verwendung.
  • Natives VS-Code-Plugin zur Verfügung, ähnlich wie das Codex-Plugin von OpenAI.
  • Claude Code SDK wurde offiziell umbenannt in Claude Agent SDK, die Verbesserung der Fähigkeiten der Agentenbildung.
  • Terminal-Schnittstelle wurde grundlegend umgestaltet, so dass die Benutzer beim Start den Verlauf früherer Sitzungen und die Listen neuer Funktionen auf einen Blick sehen können.
New Features and Tool Upgrades of Claude Sonnet 4.5

Anthropic hat sogar die zugrundeliegende Infrastruktur, die sie zur Erstellung von Claude Code verwenden, die so genannte Claude Agent SDK.

Die Verwaltung des Speichers für Agenten bei lang laufenden Aufgaben, die Entwicklung von Berechtigungssystemen, die ein Gleichgewicht zwischen Autonomie und Benutzerkontrolle herstellen, und die Koordinierung mehrerer Unteragenten zur Erreichung von Zielen sind allesamt herausfordernde Aspekte bei der Entwicklung und dem Entwurf von KI-Agenten.

Mit dem Claude Agent SDK, können Sie diese Infrastruktur nun nutzen, um Ihre eigenen Produkte zu entwickeln.

Frühe Nutzerreaktionen: Eine Hassliebe

Ab heute können Entwickler die claude-sonnet-4-5 über die Claude-API. Die Preisgestaltung ist gegenüber Sonnet 4 unverändert: $3/$15 pro Million Token.

Die ersten Tester sind bereits beeindruckt:

Ein Entwickler teilte seine Erfahrungen unmittelbar nach dem Ausprobieren mit:

“Claude 4.5 Sonnet hat gerade meine gesamte Codebasis in einem einzigen Durchgang umstrukturiert - 25 Toolaufrufe, über 3.000 neue Codezeilen und 12 brandneue Dateien. Es hat alles modularisiert, die monolithische Struktur aufgebrochen und den Spaghetti-Code bereinigt. Das Ergebnis lief zwar nicht wirklich, aber wow, es war wirklich elegant.” Diese Rezension fühlt sich an wie eine Mischung aus Liebe und Frustration.

Cursor gab an, dass sie mit Claude Sonnet 4.5 eine bahnbrechende Programmierleistung beobachten konnten, insbesondere Verbesserungen bei der Handhabung von Aufgaben mit langer Laufzeit. Dies erklärt auch, warum viele Cursor-Benutzer Claude wählen, um die komplexesten Probleme zu bewältigen.

Der bekannte Tech-Blogger Dan Shipper stellte fest, dass sich Claude 4.5 schneller, kontrollierbarer und stabiler.

Erhöhte Sicherheit: Die bisher beste Ausrichtung

Leistung ist eine Sache, aber die Sicherheit muss Schritt halten.

Claude Sonnet 4.5 ist nach Angaben von Anthropic ihr bisher am besten abgestimmtes Spitzenmodell.

Dank der erweiterten Fähigkeiten von Claude in Verbindung mit einem strengen Sicherheitstraining hat Anthropic das Verhalten der Modelle erheblich verbessert und Tendenzen wie Kriecherei, Täuschung, Machtstreben und die Förderung von Wahnvorstellungen verringert. Darüber hinaus hat Anthropic bedeutende Durchbrüche bei der Abwehr von Prompt-Injection-Angriffen und der Minimierung von Fehlklassifizierungen von Inhalten erzielt.

Claude Sonnet 4.5 Experimentelle Funktion: Vorstellen mit Claude

Gleichzeitig startete Anthropic eine temporäre Forschungsvorschau genannt. Vorstellen mit Claude. In diesem Modus generiert Claude Software in Echtzeit - keine der Funktionen oder der Code sind bereits geschrieben. Alles wird an Ort und Stelle interaktiv erstellt und angepasst.

Diese Vorschau ist nur verfügbar für Claude Max Abonnenten in den nächsten 5 Tagen.

Zugang hier:https://claude.ai/imagine/

Claude Sonnet 4.5 Experimental Feature: “Imagine with Claude”

Marktwettbewerb und strategische Bedeutung von Claude Sonnet 4.5

Der Wert von Anthropic liegt derzeit bei $183 Milliarden, mit einem Jahresumsatz von $5 Mrd. (Stand: August) - ein großer Teil davon entfällt auf Codierungstools. Doch der Wettbewerb ist hart: OpenAI und Google Gemini sind ebenfalls im Rennen um die Vorherrschaft auf dem Entwicklermarkt.

Die jährliche Entwicklerkonferenz von OpenAI ist nur noch eine Woche entfernt. Dass Anthropic Claude 4.5 jetzt fallen lässt, ist ein klarer Schritt, um Druck auszuüben.

Der Mitbegründer und Chefwissenschaftler von Anthropic, Jared Kaplan, hat bereits angedeutet, dass eine noch fortschrittlichere Modell Claude Opus wird noch in diesem Jahr auf den Markt kommen.

Frühere Probleme und Wiederherstellung des Vertrauens der Nutzer

Nicht alles verlief reibungslos. In den letzten zwei Monaten warfen die Nutzer der Claude-Serie vor, sie sei “dumm” geworden. Viele berichteten, dass die Qualität der Argumentation, der Kodierung, der Formatierung und der Verwendung von Werkzeugen stark abgenommen hat - sogar zahlende Max-Abonnenten.

Anthropic räumte zwei unabhängige Fehler ein und nahm das Opus 4.1-Update zurück, wobei es Kosteneinsparungsgründe verneinte. Aber ohne Entschädigung oder Rückerstattung verbreitete sich die Gegenreaktion auf GitHub und X, wobei einige Nutzer zu Konkurrenten wie Codex wechselten.

Die Freigabe von Claude Sonett 4.5 ist die Chance für Anthropic, sie zurückzugewinnen. Ob dies gelingt, wird davon abhängen, wie sich das Modell in den kommenden Wochen in der Praxis bewährt.

Teilen Sie den Beitrag:

Verwandte Beiträge

GlobalGPT
  • Klüger arbeiten mit der #1 All-in-One AI-Plattform
  • Alles an einem Ort: AI-Chat, Schreiben, Recherchieren und Erstellen beeindruckender Bilder und Videos
  • Sofortiger Zugang 100+ Top AI Modelle & Agenten - GPT-5, Sora 2 & Pro, Perplexity, Veo 3.1, Claude, & mehr