비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

윈드서프, 코딩 넘어 소프트웨어 엔지니어링 전체 과정 최적화한 'SWE-1' 모델 공개

2025.05.16. 18:37:45
조회 수
440
11

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

윈드서프(Windsurf)가 코딩 작업뿐만 아니라 소프트웨어 엔지니어링 전체 프로세스를 위해 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시했다. 윈드서프는 지난 15일(현지 시간) 자사 블로그를 통해 "오늘 소프트웨어 엔지니어링 전체 과정에 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시한다"고 발표했다.

이번에 출시된 SWE-1 제품군은 세 가지 다른 모델로 구성됐다. 먼저 기본 모델인 'SWE-1'은 앤트로픽(Anthropic)의 클로드 3.5 소넷(Claude 3.5 Sonnet) 수준의 도구 호출 추론 능력을 갖추면서도 더 저렴한 서비스가 가능하다. 이 모델은 프로모션 기간 동안 모든 유료 사용자에게 무료로 제공된다. 중간 크기 모델인 'SWE-1-lite'는 기존의 캐스케이드 베이스(Cascade Base)를 대체하면서 더 나은 품질을 제공한다. 무료와 유료 사용자 모두 무제한으로 사용할 수 있다. 가장 작은 모델인 'SWE-1-mini'는 매우 빠른 속도로 모든 사용자에게 윈드서프 탭(Windsurf Tab) 패시브 경험을 제공한다.

윈드서프는 SWE-1을 개발한 이유에 대해 "소프트웨어 개발 속도를 99% 가속화하는 것이 목표다. 코드 작성은 개발자가 하는 일의 일부분일 뿐이며, '코딩 가능한' 모델만으로는 충분하지 않다"고 설명했다. 윈드서프에 따르면, 지난 몇 년간 코딩 가능한 모델들은 크게 발전했다. 이전에는 짧은 자동 완성 제안을 만드는 정도였던 모델에 대한 기대치가 이제는 한 번에 간단한 애플리케이션을 안정적으로 구축하는 수준으로 높아졌다.

그러나 이러한 모델들이 곧 한계에 도달할 것이라고 윈드서프는 지적했다. 첫째, 소프트웨어 개발자의 모든 시간이 코드 작성에만 소요되는 것은 아니다. 개발자들은 더 많은 유형의 작업을 다양한 환경에서 수행하기 때문에 모델에 대한 기대치가 더 높아져야 한다. 코드를 읽고 쓰는 것뿐만 아니라 터미널에서 작업하고, 다른 지식과 인터넷에 접근하며, 제품을 테스트하고, 사용자 피드백을 이해하는 등 소프트웨어 개발자가 하는 모든 일을 지원해야 한다.

둘째, 소프트웨어 개발 작업은 길고 불완전한 상태로 진행된다. 오늘날 최고의 기반 모델들은 주로 전술적 작업에 집중되어 있다. 그러나 개발자에게 단위 테스트는 더 큰 엔지니어링 문제의 일부일 뿐이다. 오늘 작동하는 기능을 구현하는 방법은 많지만, 향후 몇 년 동안 계속 구축할 수 있는 좋은 방법은 훨씬 적다. 이것이 모델이 사용자의 적극적인 지침과 함께 캐스케이드(Cascade)에서 훌륭한 성능을 보이지만, 독립적으로 작동하는 시간이 길어질수록 성능이 현저히 떨어지는 이유다.

SWE-1은 윈드서프 에디터(Windsurf Editor)의 통찰력을 바탕으로 불완전한 상태, 장기 실행 작업 및 다중 환경을 포함하는 완전히 새로운 데이터 모델(공유 타임라인)과 훈련 레시피를 구축했다. 초기 목표는 연구소보다 적은 엔지니어와 컴퓨팅 파워로도 최신 기술 수준의 성능에 도달할 수 있다는 것을 증명하는 것이었다.

오프라인 평가에서 SWE-1은 앤트로픽 제품군을 비롯한 모든 비최첨단 모델과 오픈웨이트 대안보다 우수한 성능을 보였다. 윈드서프는 대화형 SWE 작업 벤치마크와 엔드투엔드 SWE 작업 벤치마크를 통해 성능을 비교했다. 대화형 SWE 작업 벤치마크는 기존 캐스케이드 세션 중간에서 반쯤 완료된 작업이 있을 때 캐스케이드가 다음 사용자 쿼리를 얼마나 잘 처리하는지 측정한다. 엔드투엔드 SWE 작업 벤치마크는 대화의 처음부터 시작하여 캐스케이드가 선택된 단위 테스트를 통과하여 입력 의도를 얼마나 잘 처리하는지 측정한다.

또한 윈드서프는 대규모 사용자 커뮤니티를 활용한 실제 프로덕션 실험을 통해 오프라인 평가를 보완했다. 사용자당 일일 기여 라인 수와 캐스케이드 기여율을 측정했는데, SWE-1은 이러한 실험에서도 업계 선도적인 성능을 보였다. 윈드서프는 플로우 인식 시스템을 통해 SWE-1을 가능하게 했다고 설명했다. 플로우 인식이란 사용자와 AI 간의 포괄적인 상태가 원활하게 얽혀 있는 것을 의미한다. AI가 하는 모든 것을 인간이 관찰하고 행동할 수 있어야 하며, 인간이 하는 모든 것을 AI가 관찰하고 행동할 수 있어야 한다.

윈드서프는 앞으로 SWE 모델 제품군의 개선 사항에 대해 계속 소식을 전할 계획이며, 사용자에게 최저 비용으로 최고의 성능을 제공하기 위해 더 많은 투자를 할 것이라고 밝혔다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 윈드서프

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
주가 상승 쉽지 않네. 공매도와 전쟁 중인 게임업계 게임동아
"기초적인 후드티다" '사이버펑크: 엣지러너' 무신사 컬래버 의류 25일 출시 게임동아
"플스에서 뵙겠습니다~" '어바우드' PS5 버전 출시 및 1주년 업데이트 게임동아
데브시스터즈 ‘쿠키런: 오븐스매시’, 열흘 만에 사전 등록 100만 명 돌파 게임동아
[LCK] “승승패패패” 충격의 T1 탈락 속 디플러스 기아의 홍콩행 게임동아
뉴노멀소프트 ‘창세기전 키우기’ 사전예약 시작 게임동아
다나와, 메모리 가격 상승세 속 ‘DDR5 16GB’ 1천원 래플 진행 다나와
[시승기] 'KGM 무쏘' 타스만 보고 있나, 픽업트럭은 이렇게 만드는 거야. (1) 오토헤럴드
[시승기] 제네시스 GV60 마그마, 공로 시승 해 봤습니다. (1) 오토헤럴드
[시승기] '매일 타기 편하고 오래 타는 SUV' 혼다 CR-V 하이브리드 오토헤럴드
GM이 소형 SUV 46만 대를 공급하는 핵심 생산 거점을 포기할까? 오토헤럴드
'전고체 상용화 가속' 간펑 리튬, 650Wh/kg 반고체 배터리 양산 돌입 (1) 오토헤럴드
'별점 하나의 무게란' 자동차 실내에 다시 등장하기 시작한 물리 버튼 오토헤럴드
[모빌리티 인사이트] '할인' 넘어 '가격 인하' 전기차 시장 구조 흔들 (1) 오토헤럴드
애플, 2026년부터 F1 경기 IMAX 영화관서 생중계한다 글로벌오토뉴스
“벚꽃 따라 남에서 북으로”…설 이후 봄 여행 검색 65% 급증, 어디가 가장 인기? 뉴스탭
‘솔로지옥5’ 최미나수, 이번엔 스윔웨어로…배럴 화보서 드러난 진짜 매력 뉴스탭
“DDR5 램을 1천원에?” 다나와, 파격 래플 이벤트 전격 실시 뉴스탭
싱가포르 센토사 해변에 ‘아기상어’ 떴다…5천명 동시 수용 워터파크 팝업 개막 뉴스탭
남주혁·장원영이 입자 달라졌다…아이더 2026 S/S, 도심까지 넘본다 뉴스탭
이 시간 HOT 댓글!
1/4