출처 : 앤트로픽 뉴스룸(이하 동일)
AI 스타트업 앤트로픽(Anthropic)이 자사의 최신 언어모델 업그레이드 버전인 ‘Claude Opus 4.1’을 6일 공개했다. 이번 버전은 이전 모델인 Opus 4 대비 에이전트형 작업(agentic tasks), 실전 코딩(real-world coding), 추론(reasoning) 성능에서 전반적인 향상이 이뤄졌다.
Opus 4.1은 대표적인 코딩 벤치마크인 SWE-bench Verified에서 74.5%의 정확도를 기록하며, 자사 최고 성능을 갱신했다. 특히 깊이 있는 리서치, 데이터 분석, 디테일 추적, 에이전트 기반 검색(agentic search) 분야에서 강화된 성능을 보여준다.
GitHub는 이번 업그레이드에 대해 “대부분의 기능에서 Opus 4 대비 향상이 있었으며, 특히 다중 파일 코드를 리팩토링(refactoring) 하는 능력이 눈에 띄게 향상됐다”고 평가했다.
라쿠텐 그룹(Rakuten Group)은 “Opus 4.1은 대규모 코드베이스 내에서도 불필요한 변경이나 버그 없이 정확한 수정 위치를 정확히 집어내는 정밀함을 보여준다”며, “일상적인 디버깅 작업에서 높은 선호도를 보였다”고 밝혔다.
또한 스타트업 Windsurf는 “Opus 4.1이 자사 주니어 개발자 벤치마크 기준에서 Opus 4보다 표준편차 1만큼 향상된 성능을 기록했으며, 이는 마치 Sonnet 3.7에서 Sonnet 4로 업그레이드한 것과 유사한 점프”라고 설명했다.
Opus 4.1은 현재 유료 Claude 사용자와 Claude Code 환경에서 즉시 사용 가능하며, API, 아마존 베드록(Amazon Bedrock), 구글 클라우드 Vertex AI 플랫폼에서도 제공된다. 가격은 기존 Opus 4와 동일하다. 개발자라면 API에서 claude-opus-4-1-20250805 모델을 호출하여 바로 사용할 수 있으며, 관련 시스템 카드, 모델 정보 페이지, 가격표, 문서 등도 함께 제공되고 있다.
앤트로픽은 “사용자 피드백은 모델 개선에 매우 중요하다”며, “앞으로도 더 강력한 기능을 갖춘 신형 모델들을 지속 출시할 예정”이라고 전했다.
글 / 김지훈 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com