GlobalGPT

클로드 소네트 4.5: 30시간 이상 쉬지 않고 코딩할 수 있는 가장 강력한 AI

claude-sonnet-4-5-the-most-powerful-ai-for-30-hours-of-nonstop-coding

앤트로픽이 공식 출시되었습니다. 클로드 소네트 4.5, 그 결과는 놀랍습니다.

참고로 ChatGPT를 다음과 함께 사용하고 싶다면 쌍둥이자리 및 기타 최고의 AI 모델을 매우 저렴한 가격으로 이용할 수 있습니다, 글로벌 GPT 는 통합된 올인원 환경을 제공합니다.

클로드 소네트 4.5, SWE 벤치 검증 리더보드 1위 달성

에서 SWE 벤치 검증 실제 프로그래밍 능력을 평가하는 테스트에서 클로드 소네트 4.5는 다음을 수행했습니다. 업계 1위의 #1 자리.

더 미친 듯이? 집중력을 유지하고 지속적으로 작업할 수 있습니다. 30시간 이상 연속.

네, 인공지능은 인간에 비해 또 하나의 이점을 추가했습니다.

Claude Sonnet 4.5 tops the SWE-bench Verified leaderboard

탁월한 코딩 능력: 숨 쉬는 듯한 앱 구축

예를 들어, Slack 또는 Teams와 유사한 채팅 앱을 구축하는 작업을 맡았을 때, 다음과 같은 결과가 나왔습니다. 한 번에 11,000줄의 코드 작성. 이에 비해 구형 Claude Opus 4와 Codex는 약 7시간 동안만 연속 작업을 처리할 수 있었습니다.

Anthropic에 따르면, 클로드 소네트 4.5는 이제 세계에서 가장 강력한 코딩 모델입니다. - 복잡한 에이전트 구축, 컴퓨터 연산, 추론 및 수학을 대폭 개선했습니다.

 Claude Sonnet 4.5 is now the world’s most powerful coding model

켜짐 OSWorld, 실제 컴퓨터 작업을 테스트하기 위해 고안된 벤치마크에서 다음과 같은 점수를 받았습니다. 61.4%, 가 다시 1위를 차지했습니다. 불과 4개월 전만 해도 소네트 4는 42.2%로 선두를 차지했으니 성능 향상이 놀랍습니다.

Claude Sonnet 4.5 achieving 61.4% on the OSWorld benchmark for real computer tasks

새로운 기능 및 도구 업그레이드 의 클로드 소네트 4.5

또한, 새로운 모델과 함께 몇 가지 주요 업그레이드를 실시했습니다:

  • 체크포인트 지원 를 사용할 수 있게 되어 진행 상황을 저장하고 언제든지 이전 상태로 롤백할 수 있게 되었습니다.
  • 사용 정보 를 사용하여 클로드 코드 내에서 직접 쿼리할 수 있습니다. /사용.
  • 네이티브 VS 코드 플러그인 를 사용할 수 있으며, OpenAI의 코덱스 플러그인과 유사합니다.
  • 클로드 코드 SDK 의 공식 명칭이 클로드 에이전트 SDK, 를 통해 에이전트 구축 기능을 강화합니다.
  • 터미널 인터페이스 가 대폭 개편되어 사용자가 시작과 동시에 이전 세션 기록과 새로운 기능 목록을 한 눈에 볼 수 있습니다.
New Features and Tool Upgrades of Claude Sonnet 4.5

앤트로픽은 클루드 코드를 구축하는 데 사용하는 기본 인프라를 공개하기도 했습니다. 클로드 에이전트 SDK.

장기 실행 작업 중 에이전트의 메모리 관리, 자율성과 사용자 제어의 균형을 맞추는 권한 시스템 설계, 목표 달성을 위한 여러 하위 에이전트의 조정은 모두 AI 에이전트 구축 및 설계의 어려운 측면입니다.

와 함께 클로드 에이전트 SDK, 이제 이 인프라를 활용하여 자체 제품을 구축할 수 있습니다.

초기 사용자 반응: 애증의 관계

오늘부터 개발자는 다음과 같이 전화할 수 있습니다. 클로드-소네트-4-5 를 통해 이용할 수 있습니다. 가격은 소네트 4에서 변경되지 않았습니다: 백만 토큰당 $3/$15.

초기 테스터들은 이미 깊은 인상을 받았습니다:

한 개발자는 사용해 본 직후 자신의 경험을 공유했습니다:

“Claude 4.5 Sonnet은 단 한 번의 실행으로 전체 코드베이스를 리팩터링하여 25개의 도구 호출, 3,000줄 이상의 새로운 코드, 12개의 새로운 파일을 생성했습니다. 모든 것을 모듈화하고, 모놀리식 구조를 분해하고, 스파게티 코드를 정리했습니다. 결과물은 실제로 실행되지는 않았지만 정말 우아했습니다.” 이 리뷰는 애정과 좌절이 뒤섞인 느낌입니다.

커서는 클로드 소네트 4.5를 통해 최첨단 프로그래밍 성능, 특히 장시간 작업 처리가 개선된 것을 확인했다고 밝혔습니다. 이는 많은 Cursor 사용자가 가장 복잡한 문제를 해결하기 위해 Claude를 선택하는 이유를 더욱 설명해줍니다.

유명 리뷰어 기술 블로거인 Dan Shipper는 Claude 4.5의 느낌에 대해 다음과 같이 언급했습니다. 더 빠르고, 더 제어 가능하며, 더 안정적입니다..

향상된 안전성: 역대 최고 수준의 정렬

성능도 중요하지만 안전도 그에 발맞춰야 합니다.

앤트로픽에 따르면 클로드 소네트 4.5는 지금까지 출시된 제품 중 가장 최신의 모델이라고 합니다.

엄격한 안전 교육과 함께 Claude의 향상된 기능 덕분에 Anthropic은 모델 행동이 크게 개선되어 위선, 기만, 권력 추구, 망상 조장 등의 경향을 줄였습니다. 또한, Anthropic은 즉각적인 인젝션 공격을 방어하고 콘텐츠 오 분류를 최소화하는 데 있어 획기적인 성과를 거두었습니다.

클로드 소네트 4.5 실험적 기능: 클로드와 함께 상상하기

동시에 Anthropic은 임시 연구 미리보기 호출 클로드와 함께 상상해 보세요.. 이 모드에서는 기능이나 코드가 미리 작성되지 않고 실시간으로 소프트웨어를 생성합니다. 모든 것이 그 자리에서 대화형으로 생성되고 조정됩니다.

이 미리 보기는 다음 경우에만 사용할 수 있습니다. 클로드 맥스 구독자 앞으로 5일 동안.

여기에서 액세스하기:https://claude.ai/imagine/

Claude Sonnet 4.5 Experimental Feature: “Imagine with Claude”

클로드 소네트 4.5의 시장 경쟁과 전략적 중요성

앤트로픽의 현재 가치는 다음과 같습니다. $183억, 는 8월 현재 연간 매출 1조 4,500억 달러에 달하며, 그 중 대부분이 코딩 도구에 힘입어 성장하고 있습니다. 하지만 경쟁은 치열합니다: OpenAI와 구글 제미니 도 개발자 시장을 장악하기 위해 경쟁하고 있습니다.

특히 OpenAI의 연례 개발자 컨퍼런스가 불과 일주일 앞으로 다가왔습니다. 앤트로픽이 클로드 4.5를 공개한 것은 분명 압력을 가하기 위한 조치입니다.

앤트로픽의 공동 창립자이자 수석 과학자인 제러드 카플란은 이미 훨씬 더 진보된 형태의 클로드 오푸스 모델 는 올해 말 출시될 예정입니다.

과거 문제와 사용자 신뢰 회복

모든 것이 순조롭지만은 않았습니다. 지난 두 달 동안 사용자들은 Claude 시리즈가 “멍청해졌다”고 비난했습니다. 많은 사용자가 추론, 코딩, 서식 지정 및 도구 사용 품질이 급격히 떨어졌다고 보고했으며, 심지어 유료 Max 구독자들도 마찬가지였습니다.

Anthropic은 두 가지 독립적인 버그를 인정하고 Opus 4.1 업데이트를 롤백하면서 비용 절감의 동기를 부인했습니다. 그러나 보상이나 환불이 이루어지지 않자 GitHub와 X에서 반발이 확산되었고 일부 사용자는 Codex와 같은 경쟁업체로 전환했습니다.

의 출시 클로드 소네트 4.5 는 Anthropic이 고객들의 마음을 되돌릴 수 있는 기회입니다. 성공 여부는 앞으로 몇 주 동안 실제 사용 환경에서 모델이 어떻게 작동하는지에 따라 달라질 것입니다.

게시물을 공유하세요:

관련 게시물

GlobalGPT
  • 더 스마트한 업무 #1 올인원 AI 플랫폼으로
  • 모든 것을 한 곳에서: AI 채팅, 글쓰기, 조사, 멋진 이미지 및 동영상 제작
  • 즉시 액세스 100개 이상의 인기 AI 모델 및 에이전트 - GPT-5, 소라 2 및 프로, 퍼플렉시티, 베오 3.1, 클로드 등