Claude Sonnet 4.5: la IA más potente para más de 30 horas de programación ininterrumpida

2025-09-30
05:47
Claude McKenzie
Última actualización 2025-11-05

Anthropic acaba de publicar oficialmente Claude Soneto 4.5, y los resultados son asombrosos.

Por cierto, si desea utilizar ChatGPT con Géminis y otros modelos superiores de IA a un precio extremadamente bajo, GPT global ofrece una experiencia integrada todo en uno.

Pruebe Claude Sonnet 4.5 ahora ！

Claude Sonnet 4.5 encabeza la clasificación de SWE-bench Verified

En el SWE-bench Verificado que evalúa la capacidad de programación en el mundo real, Claude Sonnet 4.5 obtuvo el #1 punto en la industria.

¿Aún más loco? Puede permanecer concentrado y trabajar continuamente durante más de 30 horas seguidas.

Sí, la IA acaba de añadir otra ventaja sobre los humanos.

Claude Sonnet 4.5 tops the SWE-bench Verified leaderboard

Potencia de codificación inigualable: crear aplicaciones como respirar

Por ejemplo, cuando se le encargó crear una aplicación de chat similar a Slack- o Teams, produjo 11.000 líneas de código en una sola sesión. En comparación, los antiguos Claude Opus 4 y Codex sólo podían trabajar unas 7 horas seguidas.

Según Anthropic, Soneto Claude 4.5 es ahora el modelo de codificación más potente del mundo - con mejoras masivas en la construcción de agentes complejos, operaciones informáticas, razonamiento y matemáticas.

Claude Sonnet 4.5 is now the world’s most powerful coding model

En OSWorld, una prueba de referencia diseñada para comprobar tareas informáticas reales, obtuvo una puntuación de 61.4%, ocupando de nuevo el primer puesto. Hace solo cuatro meses, Sonnet 4 lideraba con 42,2%, por lo que el salto de rendimiento es asombroso.

Claude Sonnet 4.5 achieving 61.4% on the OSWorld benchmark for real computer tasks

Nuevas funciones y actualizaciones de herramientas de Claude Soneto 4.5

Anthropic también ha introducido varias mejoras importantes junto con el nuevo modelo:

Compatibilidad con puntos de control que permite guardar el progreso y volver a estados anteriores en cualquier momento.
Información de uso ahora puede consultarse directamente en Claude Code utilizando /uso.
Plugin nativo de VS Code similar al plugin Codex de OpenAI.
Código Claude SDK ha pasado a llamarse oficialmente SDK del agente Claude, potenciando las capacidades de creación de agentes.
Interfaz del terminal se ha rediseñado significativamente, lo que permite a los usuarios ver el historial de sesiones anteriores y las listas de nuevas funciones de un vistazo nada más iniciarse.

New Features and Tool Upgrades of Claude Sonnet 4.5

Anthropic ha abierto incluso la infraestructura subyacente que utiliza para crear Claude Code, llamada SDK del agente Claude.

La gestión de la memoria de los agentes durante las tareas de larga duración, el diseño de sistemas de permisos que equilibren la autonomía y el control del usuario, y la coordinación de múltiples subagentes para alcanzar objetivos son aspectos que suponen todo un reto a la hora de construir y diseñar agentes de IA.

Con el SDK del agente Claude, Ahora puede aprovechar esta infraestructura para crear sus propios productos.

Primeras reacciones de los usuarios: Una relación de amor-odio

A partir de hoy, los desarrolladores pueden llamar a claude-sonnet-4-5 a través de la API Claude. El precio no ha cambiado con respecto a Sonnet 4: $3/$15 por millón de fichas.

Los primeros usuarios ya están impresionados:

Un desarrollador compartió su experiencia inmediatamente después de probarlo:

“Claude 4.5 Sonnet acaba de refactorizar todo mi código base en una sola ejecución: 25 invocaciones a herramientas, más de 3.000 nuevas líneas de código y 12 archivos completamente nuevos. Modularizó todo, rompió la estructura monolítica y limpió el código espagueti. El resultado no funcionó, pero era realmente elegante”. Esta reseña es una mezcla de amor y frustración.

Cursor afirma haber observado un rendimiento de programación puntero con Claude Sonnet 4.5, especialmente con mejoras en el manejo de tareas de larga duración. Esto explica aún más por qué muchos usuarios de Cursor eligen Claude para abordar los problemas más complejos.

El conocido bloguero tecnológico Dan Shipper ha señalado que Claude 4.5 parece más rápido, más controlable y más estable.

Mayor seguridad: La mayor alineación hasta la fecha

El rendimiento es una cosa, pero la seguridad debe ir a la par.

Claude Sonnet 4.5 es, según Anthropic, su modelo de vanguardia más alineado hasta la fecha.

Gracias a las capacidades mejoradas de Claude, combinadas con una rigurosa formación en seguridad, Anthropic ha logrado mejoras significativas en el comportamiento de los modelos, reduciendo tendencias como la adulación, el engaño, la búsqueda de poder y el fomento del delirio. Además, Anthropic ha logrado importantes avances en la defensa contra ataques de inyección puntual y la minimización de la clasificación errónea de contenidos.

Característica experimental de Claude Sonnet 4.5: Imagine con Claude

Al mismo tiempo, Anthropic lanzó una avance temporal de la investigación llamado Imagina con Claude. En este modo, Claude genera software en tiempo real: ninguna de las funciones ni el código están escritos de antemano. Todo se crea y ajusta interactivamente sobre la marcha.

Esta vista previa sólo está disponible para Claude Max abonados durante los próximos 5 días.

Acceda aquí：https://claude.ai/imagine/

Claude Sonnet 4.5 Experimental Feature: “Imagine with Claude”

Competencia en el mercado e importancia estratégica del soneto Claude 4.5

Anthropic está valorado actualmente en $183 mil millones, con unos ingresos anuales de 1.400 millones de euros en agosto, en gran parte gracias a las herramientas de codificación. Pero la competencia es feroz: OpenAI y Google Gemini también compiten por dominar el mercado de los desarrolladores.

La conferencia anual de desarrolladores de OpenAI se celebrará dentro de una semana. Que Anthropic baje ahora a Claude 4.5 es una clara medida de presión.

El cofundador y científico jefe de Anthropic, Jared Kaplan, ya ha adelantado que un modelo aún más avanzado de Modelo Claude Opus se lanzará a finales de este año.

Problemas anteriores y recuperación de la confianza de los usuarios

No todo ha sido coser y cantar. En los últimos dos meses, los usuarios han acusado a la serie Claude de estar “embrutecida”. Muchos informaron de un fuerte descenso en la calidad del razonamiento, la codificación, el formato y el uso de herramientas, incluso los suscriptores de pago de Max.

Anthropic admitió dos errores independientes y retiró la actualización Opus 4.1, negando motivos de reducción de costes. Pero sin compensación ni reembolsos, la reacción se extendió en GitHub y X, y algunos usuarios se pasaron a competidores como Codex.

La liberación de Claude Soneto 4.5 es la oportunidad de Anthropic para recuperarlos. Su éxito dependerá de cómo se comporte el modelo en el mundo real en las próximas semanas.

Comparte el post: