GlobalGPT

Claude Sonnet 4.5 : L'IA la plus puissante pour plus de 30 heures de codage non-stop

claude-sonnet-4-5-the-most-powerful-ai-for-30-hours-of-nonstop-coding

Anthropic vient de publier officiellement Claude Sonnet 4.5, et les résultats sont stupéfiants.

D'ailleurs, si vous souhaitez utiliser ChatGPT avec Gémeaux et d'autres modèles d'IA de haut niveau à un prix extrêmement bas, Global GPT offre une expérience intégrée tout-en-un.

Claude Sonnet 4.5 en tête du classement vérifié du banc d'essai SWE

Sur le site Banc SWE Vérifié qui évalue les capacités de programmation dans le monde réel - Claude Sonnet 4.5 a obtenu la meilleure note. #1 spot dans l'industrie.

Encore plus fou ? Il peut rester concentré et travailler en continu pendant plus de 30 heures d'affilée.

Oui, l'IA vient d'ajouter un avantage supplémentaire par rapport à l'homme.

Claude Sonnet 4.5 tops the SWE-bench Verified leaderboard

Une puissance de codage inégalée : construire des applications comme on respire

Par exemple, lorsqu'il a été chargé de créer une application de chat de type Slack- ou Teams, il a produit 11 000 lignes de code en une seule séance. En comparaison, les anciens Claude Opus 4 et Codex ne pouvaient travailler qu'environ 7 heures d'affilée.

Selon Anthropic, Sonnet de Claude 4.5 est désormais le modèle de codage le plus puissant au monde - avec des améliorations massives dans la construction d'agents complexes, les opérations informatiques, le raisonnement et les mathématiques.

 Claude Sonnet 4.5 is now the world’s most powerful coding model

Sur OSWorld, un critère de référence conçu pour tester des tâches informatiques réelles, il a obtenu le score suivant 61.4%, qui occupe à nouveau la première place. Il y a seulement quatre mois, Sonnet 4 était en tête avec 42,2% - le saut de performance est donc stupéfiant.

Claude Sonnet 4.5 achieving 61.4% on the OSWorld benchmark for real computer tasks

Nouvelles fonctionnalités et mises à jour des outils de Claude Sonnet 4.5

Anthropic a également procédé à plusieurs mises à jour importantes en même temps que le nouveau modèle :

  • Soutien aux points de contrôle est enfin disponible, ce qui permet de sauvegarder l'état d'avancement et de revenir à des états antérieurs à tout moment.
  • Informations sur l'utilisation peut désormais être interrogé directement dans Claude Code en utilisant la fonction /usage.
  • Plugin VS Code natif est disponible, à l'instar du plugin Codex d'OpenAI.
  • Code Claude SDK a été officiellement rebaptisée SDK de l'agent Claude, Le projet a pour but d'améliorer les capacités des agents à se constituer un réseau.
  • Interface du terminal a été considérablement remanié, ce qui permet aux utilisateurs de voir l'historique des sessions précédentes et la liste des nouvelles fonctionnalités d'un seul coup d'œil au démarrage.
New Features and Tool Upgrades of Claude Sonnet 4.5

Anthropic a même ouvert l'infrastructure sous-jacente qu'elle utilise pour construire Claude Code, appelée SDK de l'agent Claude.

La gestion de la mémoire des agents pendant les tâches de longue durée, la conception de systèmes d'autorisation équilibrant l'autonomie et le contrôle de l'utilisateur, et la coordination de plusieurs sous-agents pour atteindre des objectifs sont autant d'aspects délicats de la construction et de la conception d'agents d'intelligence artificielle.

Avec la SDK de l'agent Claude, Vous pouvez désormais tirer parti de cette infrastructure pour créer vos propres produits.

Les premières réactions des utilisateurs : Une relation amour-haine

À partir d'aujourd'hui, les développeurs peuvent appeler claude-sonnet-4-5 via l'API Claude. Le prix est inchangé par rapport à Sonnet 4 : $3/$15 par million de jetons.

Les premiers testeurs sont déjà impressionnés :

Un développeur a fait part de son expérience immédiatement après l'avoir essayé :

“Claude 4.5 Sonnet vient de refactoriser l'ensemble de ma base de code en une seule fois - 25 invocations d'outils, plus de 3 000 nouvelles lignes de code et 12 nouveaux fichiers. Il a tout modularisé, brisé la structure monolithique et nettoyé le code spaghetti. Le résultat n'a pas fonctionné, mais il était vraiment élégant. Cet article est un mélange d'amour et de frustration.

Cursor a déclaré avoir observé des performances de programmation de pointe avec Claude Sonnet 4.5, en particulier des améliorations dans la gestion des tâches de longue durée. Cela explique pourquoi de nombreux utilisateurs de Cursor choisissent Claude pour s'attaquer aux problèmes les plus complexes.

Le célèbre blogueur technique Dan Shipper a noté que Claude 4.5 semble plus rapide, plus contrôlable et plus stable.

Sécurité renforcée : L'alignement le plus élevé à ce jour

La performance est une chose, mais la sécurité doit suivre.

Claude Sonnet 4.5 est, selon Anthropic, leur modèle de pointe le plus aligné à ce jour.

Grâce aux capacités accrues de Claude et à une formation rigoureuse en matière de sécurité, Anthropic a amélioré de manière significative le comportement du modèle, en réduisant les tendances telles que la flagornerie, la tromperie, la recherche de pouvoir et l'encouragement des délires. En outre, Anthropic a réalisé des percées majeures dans la défense contre les attaques par injection rapide et la minimisation des erreurs de classification du contenu.

Claude Sonnet 4.5 Fonctionnalité expérimentale : Imaginez avec Claude

Dans le même temps, Anthropic a lancé une campagne d'information et de sensibilisation. aperçu temporaire de la recherche appelé Imaginez avec Claude. Dans ce mode, Claude génère le logiciel en temps réel - aucune fonction ni aucun code n'est pré-écrit. Tout est créé et ajusté interactivement sur place.

Cet aperçu n'est disponible que pour Abonnés Claude Max au cours des 5 prochains jours.

Accédez-y ici:https://claude.ai/imagine/

Claude Sonnet 4.5 Experimental Feature: “Imagine with Claude”

Concurrence sur le marché et importance stratégique de Claude Sonnet 4.5

Anthropic est actuellement évaluée à $183 milliards, Avec un chiffre d'affaires annualisé de $5 milliards d'euros au mois d'août, les outils de codage représentent la majeure partie de ce chiffre d'affaires. Mais la concurrence est féroce : OpenAI et Google Gemini font également la course pour dominer le marché des développeurs.

Notamment, la conférence annuelle des développeurs d'OpenAI aura lieu dans une semaine. Le fait qu'Anthropic abandonne Claude 4.5 maintenant est un moyen de pression évident.

Jared Kaplan, cofondateur et directeur scientifique d'Anthropic, a déjà laissé entendre qu'une technologie encore plus avancée pourrait être mise au point. Modèle Claude Opus sera lancé dans le courant de l'année.

Problèmes passés et rétablissement de la confiance des utilisateurs

Tout n'a pas été rose. Au cours des deux derniers mois, les utilisateurs ont accusé la série Claude d'être “abrutie”. Nombre d'entre eux ont fait état d'une forte baisse de la qualité du raisonnement, du codage, du formatage et de l'utilisation des outils, même parmi les abonnés payants de Max.

Anthropic a admis l'existence de deux bogues indépendants et a annulé la mise à jour Opus 4.1, niant toute volonté de réduction des coûts. Mais sans compensation ni remboursement, les réactions se sont multipliées sur GitHub et X, certains utilisateurs se tournant vers des concurrents comme Codex.

La publication de Claude Sonnet 4.5 est l'occasion pour Anthropic de les reconquérir. Son succès dépendra de la manière dont le modèle se comportera dans le monde réel au cours des prochaines semaines.

Partager l'article :

Articles connexes

GlobalGPT
  • Travailler plus intelligemment avec la plateforme d'IA tout-en-un #1
  • Tout en un seul endroit: Chat AI, rédaction, recherche et création d'images et de vidéos époustouflantes
  • Accès instantané 100+ Top AI Models & Agents - GPT-5, Sora 2 & Pro, Perplexity, Veo 3.1, Claude, et plus encore