비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

앤트로픽, 'Claude Opus 4.1' 출시…코딩·추론 성능 대폭 향상

다나와
2025.08.07. 13:21:00
조회 수
422
7
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

출처 : 앤트로픽 뉴스룸(이하 동일)


 AI 스타트업 앤트로픽(Anthropic)이 자사의 최신 언어모델 업그레이드 버전인 ‘Claude Opus 4.1’을 6일 공개했다. 이번 버전은 이전 모델인 Opus 4 대비 에이전트형 작업(agentic tasks), 실전 코딩(real-world coding), 추론(reasoning) 성능에서 전반적인 향상이 이뤄졌다.


 Opus 4.1은 대표적인 코딩 벤치마크인 SWE-bench Verified에서 74.5%의 정확도를 기록하며, 자사 최고 성능을 갱신했다. 특히 깊이 있는 리서치, 데이터 분석, 디테일 추적, 에이전트 기반 검색(agentic search) 분야에서 강화된 성능을 보여준다.



 GitHub는 이번 업그레이드에 대해 “대부분의 기능에서 Opus 4 대비 향상이 있었으며, 특히 다중 파일 코드를 리팩토링(refactoring) 하는 능력이 눈에 띄게 향상됐다”고 평가했다.


 라쿠텐 그룹(Rakuten Group)은 “Opus 4.1은 대규모 코드베이스 내에서도 불필요한 변경이나 버그 없이 정확한 수정 위치를 정확히 집어내는 정밀함을 보여준다”며, “일상적인 디버깅 작업에서 높은 선호도를 보였다”고 밝혔다.


 또한 스타트업 Windsurf는 “Opus 4.1이 자사 주니어 개발자 벤치마크 기준에서 Opus 4보다 표준편차 1만큼 향상된 성능을 기록했으며, 이는 마치 Sonnet 3.7에서 Sonnet 4로 업그레이드한 것과 유사한 점프”라고 설명했다.



 Opus 4.1은 현재 유료 Claude 사용자와 Claude Code 환경에서 즉시 사용 가능하며, API, 아마존 베드록(Amazon Bedrock), 구글 클라우드 Vertex AI 플랫폼에서도 제공된다. 가격은 기존 Opus 4와 동일하다. 개발자라면 API에서 claude-opus-4-1-20250805 모델을 호출하여 바로 사용할 수 있으며, 관련 시스템 카드, 모델 정보 페이지, 가격표, 문서 등도 함께 제공되고 있다.


 앤트로픽은 “사용자 피드백은 모델 개선에 매우 중요하다”며, “앞으로도 더 강력한 기능을 갖춘 신형 모델들을 지속 출시할 예정”이라고 전했다.



글 / 김지훈 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
1/1
[정보/루머] 라이젠 7 7700X3D로 빈틈 노리는 AMD 및 DLSS 5의 실마리 숨겨 놓은 엔비디아 등 다나와
누가크래커·펑리수 받는다…조텍코리아, 컴퓨텍스 2026 기념 이벤트 진행 뉴스탭
‘바이브 코딩’에 지친 개발자, 라이브러리에 ‘데이터 삭제 인젝션’ 심다… AI에 그냥 넣으면 데이터 모두 사라져 AI matters
“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’ (1) AI matters
델, AI 서버 매출 가이던스 82조원으로 상향… 분기 매출 전년比 88% 폭증 AI matters
아사나, 노코드 에이전트 빌더 ‘스택AI’ 인수… ‘인간-에이전트 OS’로 체질 전환 AI matters
AWS·클라우드플레어, ‘기계 트래픽’ 시대로 클라우드 재설계… 인터넷이 봇 중심으로 다시 짜인다 AI matters
“AI가 전력망을 깨기 전에 우리가 만든다”… 넥스트에라 91조원 베팅의 진짜 노림수 AI matters
메타, 인스타·페북·와츠앱 유료 구독 글로벌 출시… AI는 ‘프리미엄’ 락인 AI matters
오픈AI, 韓 첫 ‘이그젝 서밋’ 개최… 국내 경영진 130명에 ‘업무 현장의 인텔리전스’ 청사진 공유 AI matters
베르투, 1000만 원짜리 CEO용 폰 ‘AI 폴더블’ 알파폴드 공개… 헤르메스 에이전트 기반 운영 AI matters
애피어, 6월 4일 ‘Game UA 2026’ 세미나… 에이전틱 AI로 게임·앱 마케팅 다시 짠다 AI matters
JP모건 “AI 생산성 폭발이 와야 39조 달러 부채 위기 막는다”… 무어샷 시나리오 AI matters
AI 추론 서비스 ‘파이어웍스 AI’, 22.5조 원 평가가치 펀딩 협의 AI matters
AI 코딩 스타트업 코그니션, 1.5억 원 추가 조달… 기업가치 9개월 만에 2배 AI matters
엔비디아, 대만에 연 219조 원 달러 베팅… 황 CEO “4년 전의 10배” AI matters
‘앤트로픽-스페이스X 컴퓨팅 거래는 6개월짜리’… 머스크 직접 해명 AI matters
오픈AI, 美 에너지부와 협력 MOU 확장… ‘2026은 과학의 해’ 선언 AI matters
북한의 남한 침공 다룬 '콜 오브 듀티 모던 워페어 4' 공개 (1) 게임메카
부정 예매 방지, 2026 롤드컵 티켓 '팬 퍼스트' 인증 도입 게임메카
이 시간 HOT 댓글!
1/4