비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

윈드서프, 코딩 넘어 소프트웨어 엔지니어링 전체 과정 최적화한 'SWE-1' 모델 공개

2025.05.16. 18:37:45
조회 수
48

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

윈드서프(Windsurf)가 코딩 작업뿐만 아니라 소프트웨어 엔지니어링 전체 프로세스를 위해 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시했다. 윈드서프는 지난 15일(현지 시간) 자사 블로그를 통해 "오늘 소프트웨어 엔지니어링 전체 과정에 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시한다"고 발표했다.

이번에 출시된 SWE-1 제품군은 세 가지 다른 모델로 구성됐다. 먼저 기본 모델인 'SWE-1'은 앤트로픽(Anthropic)의 클로드 3.5 소넷(Claude 3.5 Sonnet) 수준의 도구 호출 추론 능력을 갖추면서도 더 저렴한 서비스가 가능하다. 이 모델은 프로모션 기간 동안 모든 유료 사용자에게 무료로 제공된다. 중간 크기 모델인 'SWE-1-lite'는 기존의 캐스케이드 베이스(Cascade Base)를 대체하면서 더 나은 품질을 제공한다. 무료와 유료 사용자 모두 무제한으로 사용할 수 있다. 가장 작은 모델인 'SWE-1-mini'는 매우 빠른 속도로 모든 사용자에게 윈드서프 탭(Windsurf Tab) 패시브 경험을 제공한다.

윈드서프는 SWE-1을 개발한 이유에 대해 "소프트웨어 개발 속도를 99% 가속화하는 것이 목표다. 코드 작성은 개발자가 하는 일의 일부분일 뿐이며, '코딩 가능한' 모델만으로는 충분하지 않다"고 설명했다. 윈드서프에 따르면, 지난 몇 년간 코딩 가능한 모델들은 크게 발전했다. 이전에는 짧은 자동 완성 제안을 만드는 정도였던 모델에 대한 기대치가 이제는 한 번에 간단한 애플리케이션을 안정적으로 구축하는 수준으로 높아졌다.

그러나 이러한 모델들이 곧 한계에 도달할 것이라고 윈드서프는 지적했다. 첫째, 소프트웨어 개발자의 모든 시간이 코드 작성에만 소요되는 것은 아니다. 개발자들은 더 많은 유형의 작업을 다양한 환경에서 수행하기 때문에 모델에 대한 기대치가 더 높아져야 한다. 코드를 읽고 쓰는 것뿐만 아니라 터미널에서 작업하고, 다른 지식과 인터넷에 접근하며, 제품을 테스트하고, 사용자 피드백을 이해하는 등 소프트웨어 개발자가 하는 모든 일을 지원해야 한다.

둘째, 소프트웨어 개발 작업은 길고 불완전한 상태로 진행된다. 오늘날 최고의 기반 모델들은 주로 전술적 작업에 집중되어 있다. 그러나 개발자에게 단위 테스트는 더 큰 엔지니어링 문제의 일부일 뿐이다. 오늘 작동하는 기능을 구현하는 방법은 많지만, 향후 몇 년 동안 계속 구축할 수 있는 좋은 방법은 훨씬 적다. 이것이 모델이 사용자의 적극적인 지침과 함께 캐스케이드(Cascade)에서 훌륭한 성능을 보이지만, 독립적으로 작동하는 시간이 길어질수록 성능이 현저히 떨어지는 이유다.

SWE-1은 윈드서프 에디터(Windsurf Editor)의 통찰력을 바탕으로 불완전한 상태, 장기 실행 작업 및 다중 환경을 포함하는 완전히 새로운 데이터 모델(공유 타임라인)과 훈련 레시피를 구축했다. 초기 목표는 연구소보다 적은 엔지니어와 컴퓨팅 파워로도 최신 기술 수준의 성능에 도달할 수 있다는 것을 증명하는 것이었다.

오프라인 평가에서 SWE-1은 앤트로픽 제품군을 비롯한 모든 비최첨단 모델과 오픈웨이트 대안보다 우수한 성능을 보였다. 윈드서프는 대화형 SWE 작업 벤치마크와 엔드투엔드 SWE 작업 벤치마크를 통해 성능을 비교했다. 대화형 SWE 작업 벤치마크는 기존 캐스케이드 세션 중간에서 반쯤 완료된 작업이 있을 때 캐스케이드가 다음 사용자 쿼리를 얼마나 잘 처리하는지 측정한다. 엔드투엔드 SWE 작업 벤치마크는 대화의 처음부터 시작하여 캐스케이드가 선택된 단위 테스트를 통과하여 입력 의도를 얼마나 잘 처리하는지 측정한다.

또한 윈드서프는 대규모 사용자 커뮤니티를 활용한 실제 프로덕션 실험을 통해 오프라인 평가를 보완했다. 사용자당 일일 기여 라인 수와 캐스케이드 기여율을 측정했는데, SWE-1은 이러한 실험에서도 업계 선도적인 성능을 보였다. 윈드서프는 플로우 인식 시스템을 통해 SWE-1을 가능하게 했다고 설명했다. 플로우 인식이란 사용자와 AI 간의 포괄적인 상태가 원활하게 얽혀 있는 것을 의미한다. AI가 하는 모든 것을 인간이 관찰하고 행동할 수 있어야 하며, 인간이 하는 모든 것을 AI가 관찰하고 행동할 수 있어야 한다.

윈드서프는 앞으로 SWE 모델 제품군의 개선 사항에 대해 계속 소식을 전할 계획이며, 사용자에게 최저 비용으로 최고의 성능을 제공하기 위해 더 많은 투자를 할 것이라고 밝혔다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 윈드서프

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
[부고] 박병주(KPGA 투어 프로)씨 별세 연합뉴스
이예원, 두산 매치 16강 진출…박민지·홍정민·박현경도 합류(종합) 연합뉴스
PC 이용자를 위한 더 편하고 쾌적한 조명, 벤큐 스크린바 헤일로2 출시 간담회 보드나라
리그 오브 레전드, WASD 키보드 조작 도입하나? (1) 게임메카
[이구동성] 다 해줬잖아! 게임메카
토탈 이미징 솔루션 기업으로 이어진 40년, 캐논코리아 미디어 라운드 테이블 보드나라
오수민, 퀸시리키트컵 골프 개인전·단체전 석권 연합뉴스
부활 예고한 블루프로토콜, 어떤 세계 선보일까? 게임메카
앤트로픽, “스스로 실수 고치는” 새 모델 다음 달 출시 예정 AI matters
앤트로픽, AI 챗봇 '클로드' 법정 증거 왜곡 논란에 공식 사과 AI matters
윈드서프, 코딩 넘어 소프트웨어 엔지니어링 전체 과정 최적화한 'SWE-1' 모델 공개 AI matters
마이크로소프트, 앤트로픽 MCP 이어 구글 A2A 프로토콜 채택… AI 에이전트 간 연결 강화 AI matters
美 재무부, 中 AI 스타트업 '마누스' 투자 검토... 벤치마크 VC 투자 논란 AI matters
구글, 시·청각 장애인을 위한 맞춤형 AI 기능 강화… “이미지에 대한 설명 쉽게 들을 수 있어” AI matters
넷마블 '세븐나이츠 리버스', 양대 마켓 인기 1위 달성 게임동아
'SKY – 빛의 아이들', 겨울왕국 2의 목소리 'AURORA' 인게임 콘서트 6월 개최 게임동아
게임업계 양극화 더 심해졌다. 넥슨, 크래프톤 압도적 질주 (1) 게임동아
‘월드 오브 워쉽’, 벽람항로 7차 콜라보 선보인다 게임동아
넥슨, ‘마영전’ 오케스트라 공연 6월 21일 개최한다 게임동아
‘문명: 연맹의 시대’. 사전 예약 120만 돌파 (1) 게임동아
이 시간 HOT 댓글!
1/4