비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

윈드서프, 코딩 넘어 소프트웨어 엔지니어링 전체 과정 최적화한 'SWE-1' 모델 공개

2025.05.16. 18:37:45
조회 수
216
8

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

윈드서프(Windsurf)가 코딩 작업뿐만 아니라 소프트웨어 엔지니어링 전체 프로세스를 위해 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시했다. 윈드서프는 지난 15일(현지 시간) 자사 블로그를 통해 "오늘 소프트웨어 엔지니어링 전체 과정에 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시한다"고 발표했다.

이번에 출시된 SWE-1 제품군은 세 가지 다른 모델로 구성됐다. 먼저 기본 모델인 'SWE-1'은 앤트로픽(Anthropic)의 클로드 3.5 소넷(Claude 3.5 Sonnet) 수준의 도구 호출 추론 능력을 갖추면서도 더 저렴한 서비스가 가능하다. 이 모델은 프로모션 기간 동안 모든 유료 사용자에게 무료로 제공된다. 중간 크기 모델인 'SWE-1-lite'는 기존의 캐스케이드 베이스(Cascade Base)를 대체하면서 더 나은 품질을 제공한다. 무료와 유료 사용자 모두 무제한으로 사용할 수 있다. 가장 작은 모델인 'SWE-1-mini'는 매우 빠른 속도로 모든 사용자에게 윈드서프 탭(Windsurf Tab) 패시브 경험을 제공한다.

윈드서프는 SWE-1을 개발한 이유에 대해 "소프트웨어 개발 속도를 99% 가속화하는 것이 목표다. 코드 작성은 개발자가 하는 일의 일부분일 뿐이며, '코딩 가능한' 모델만으로는 충분하지 않다"고 설명했다. 윈드서프에 따르면, 지난 몇 년간 코딩 가능한 모델들은 크게 발전했다. 이전에는 짧은 자동 완성 제안을 만드는 정도였던 모델에 대한 기대치가 이제는 한 번에 간단한 애플리케이션을 안정적으로 구축하는 수준으로 높아졌다.

그러나 이러한 모델들이 곧 한계에 도달할 것이라고 윈드서프는 지적했다. 첫째, 소프트웨어 개발자의 모든 시간이 코드 작성에만 소요되는 것은 아니다. 개발자들은 더 많은 유형의 작업을 다양한 환경에서 수행하기 때문에 모델에 대한 기대치가 더 높아져야 한다. 코드를 읽고 쓰는 것뿐만 아니라 터미널에서 작업하고, 다른 지식과 인터넷에 접근하며, 제품을 테스트하고, 사용자 피드백을 이해하는 등 소프트웨어 개발자가 하는 모든 일을 지원해야 한다.

둘째, 소프트웨어 개발 작업은 길고 불완전한 상태로 진행된다. 오늘날 최고의 기반 모델들은 주로 전술적 작업에 집중되어 있다. 그러나 개발자에게 단위 테스트는 더 큰 엔지니어링 문제의 일부일 뿐이다. 오늘 작동하는 기능을 구현하는 방법은 많지만, 향후 몇 년 동안 계속 구축할 수 있는 좋은 방법은 훨씬 적다. 이것이 모델이 사용자의 적극적인 지침과 함께 캐스케이드(Cascade)에서 훌륭한 성능을 보이지만, 독립적으로 작동하는 시간이 길어질수록 성능이 현저히 떨어지는 이유다.

SWE-1은 윈드서프 에디터(Windsurf Editor)의 통찰력을 바탕으로 불완전한 상태, 장기 실행 작업 및 다중 환경을 포함하는 완전히 새로운 데이터 모델(공유 타임라인)과 훈련 레시피를 구축했다. 초기 목표는 연구소보다 적은 엔지니어와 컴퓨팅 파워로도 최신 기술 수준의 성능에 도달할 수 있다는 것을 증명하는 것이었다.

오프라인 평가에서 SWE-1은 앤트로픽 제품군을 비롯한 모든 비최첨단 모델과 오픈웨이트 대안보다 우수한 성능을 보였다. 윈드서프는 대화형 SWE 작업 벤치마크와 엔드투엔드 SWE 작업 벤치마크를 통해 성능을 비교했다. 대화형 SWE 작업 벤치마크는 기존 캐스케이드 세션 중간에서 반쯤 완료된 작업이 있을 때 캐스케이드가 다음 사용자 쿼리를 얼마나 잘 처리하는지 측정한다. 엔드투엔드 SWE 작업 벤치마크는 대화의 처음부터 시작하여 캐스케이드가 선택된 단위 테스트를 통과하여 입력 의도를 얼마나 잘 처리하는지 측정한다.

또한 윈드서프는 대규모 사용자 커뮤니티를 활용한 실제 프로덕션 실험을 통해 오프라인 평가를 보완했다. 사용자당 일일 기여 라인 수와 캐스케이드 기여율을 측정했는데, SWE-1은 이러한 실험에서도 업계 선도적인 성능을 보였다. 윈드서프는 플로우 인식 시스템을 통해 SWE-1을 가능하게 했다고 설명했다. 플로우 인식이란 사용자와 AI 간의 포괄적인 상태가 원활하게 얽혀 있는 것을 의미한다. AI가 하는 모든 것을 인간이 관찰하고 행동할 수 있어야 하며, 인간이 하는 모든 것을 AI가 관찰하고 행동할 수 있어야 한다.

윈드서프는 앞으로 SWE 모델 제품군의 개선 사항에 대해 계속 소식을 전할 계획이며, 사용자에게 최저 비용으로 최고의 성능을 제공하기 위해 더 많은 투자를 할 것이라고 밝혔다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 윈드서프

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
2025년 6월 국산차 판매조건/출고대기 정리 다나와자동차
고진영 "US오픈은 사람을 겸손하게 만들어…욕심내지 않겠다" 연합뉴스
김홍택, 골프존 G투어 4차 대회 우승…통산 15승 달성 연합뉴스
임성재, PGA 투어 메모리얼 토너먼트 3R 20위…셰플러 선두 연합뉴스
고진영, US여자오픈 골프 3R 공동 13위…선두와 6타 차이 연합뉴스
정윤지, KLPGA 투어 수협 MBN 여자오픈 2R 선두…통산 2승 도전 연합뉴스
화천군, 암극복 전국 파크골프대회 7월 8일 개최 연합뉴스
김아림, US여자오픈 2R 공동 2위…임진희·윤이나 등 상위권 연합뉴스
임성재, PGA 메모리얼 토너먼트 2R 18위…김시우는 31위로 추락 연합뉴스
신작도 대작도 없지만 모두의 게임 축제, 플레이엑스포(Play X4) 2025 현장 보드나라
정윤지·최가빈, KLPGA 수협·MBN 오픈 공동 1위…노보기 버디쇼 연합뉴스
크리에이터를 위한 스토리지 솔루션, 샌디스크 크리에이터 시리즈 출시 간담회 보드나라
일본 e스포츠 선수, 美 입국 거절당해 토너먼트 참가 박탈 (1) 게임메카
헌터x헌터 대전격투게임 체험판, 스팀서 배포 시작 (1) 게임메카
도쿄 배경 커피 톡 후속작, 스팀서 무료 체험판 배포 게임메카
베일 벗은 아이온 2, 올해 4분기 출시 목표 게임메카
후판정으로 손맛 강조한 아이온 2 “자동 전투 없다” 게임메카
블루아카X무신사 팝업 스토어, 6일 성수·홍대서 오픈 게임메카
[오늘의 스팀] 5인 협동 축구 ‘리매치’ 테스트 동접 14만 게임메카
CDPR '사이버펑크 2' 사전제작 돌입, 본격 개발 시작 (1) 게임메카
이 시간 HOT 댓글!
1/4