비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

윈드서프, 코딩 넘어 소프트웨어 엔지니어링 전체 과정 최적화한 'SWE-1' 모델 공개

2025.05.16. 18:37:45
조회 수
501
11

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

윈드서프(Windsurf)가 코딩 작업뿐만 아니라 소프트웨어 엔지니어링 전체 프로세스를 위해 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시했다. 윈드서프는 지난 15일(현지 시간) 자사 블로그를 통해 "오늘 소프트웨어 엔지니어링 전체 과정에 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시한다"고 발표했다.

이번에 출시된 SWE-1 제품군은 세 가지 다른 모델로 구성됐다. 먼저 기본 모델인 'SWE-1'은 앤트로픽(Anthropic)의 클로드 3.5 소넷(Claude 3.5 Sonnet) 수준의 도구 호출 추론 능력을 갖추면서도 더 저렴한 서비스가 가능하다. 이 모델은 프로모션 기간 동안 모든 유료 사용자에게 무료로 제공된다. 중간 크기 모델인 'SWE-1-lite'는 기존의 캐스케이드 베이스(Cascade Base)를 대체하면서 더 나은 품질을 제공한다. 무료와 유료 사용자 모두 무제한으로 사용할 수 있다. 가장 작은 모델인 'SWE-1-mini'는 매우 빠른 속도로 모든 사용자에게 윈드서프 탭(Windsurf Tab) 패시브 경험을 제공한다.

윈드서프는 SWE-1을 개발한 이유에 대해 "소프트웨어 개발 속도를 99% 가속화하는 것이 목표다. 코드 작성은 개발자가 하는 일의 일부분일 뿐이며, '코딩 가능한' 모델만으로는 충분하지 않다"고 설명했다. 윈드서프에 따르면, 지난 몇 년간 코딩 가능한 모델들은 크게 발전했다. 이전에는 짧은 자동 완성 제안을 만드는 정도였던 모델에 대한 기대치가 이제는 한 번에 간단한 애플리케이션을 안정적으로 구축하는 수준으로 높아졌다.

그러나 이러한 모델들이 곧 한계에 도달할 것이라고 윈드서프는 지적했다. 첫째, 소프트웨어 개발자의 모든 시간이 코드 작성에만 소요되는 것은 아니다. 개발자들은 더 많은 유형의 작업을 다양한 환경에서 수행하기 때문에 모델에 대한 기대치가 더 높아져야 한다. 코드를 읽고 쓰는 것뿐만 아니라 터미널에서 작업하고, 다른 지식과 인터넷에 접근하며, 제품을 테스트하고, 사용자 피드백을 이해하는 등 소프트웨어 개발자가 하는 모든 일을 지원해야 한다.

둘째, 소프트웨어 개발 작업은 길고 불완전한 상태로 진행된다. 오늘날 최고의 기반 모델들은 주로 전술적 작업에 집중되어 있다. 그러나 개발자에게 단위 테스트는 더 큰 엔지니어링 문제의 일부일 뿐이다. 오늘 작동하는 기능을 구현하는 방법은 많지만, 향후 몇 년 동안 계속 구축할 수 있는 좋은 방법은 훨씬 적다. 이것이 모델이 사용자의 적극적인 지침과 함께 캐스케이드(Cascade)에서 훌륭한 성능을 보이지만, 독립적으로 작동하는 시간이 길어질수록 성능이 현저히 떨어지는 이유다.

SWE-1은 윈드서프 에디터(Windsurf Editor)의 통찰력을 바탕으로 불완전한 상태, 장기 실행 작업 및 다중 환경을 포함하는 완전히 새로운 데이터 모델(공유 타임라인)과 훈련 레시피를 구축했다. 초기 목표는 연구소보다 적은 엔지니어와 컴퓨팅 파워로도 최신 기술 수준의 성능에 도달할 수 있다는 것을 증명하는 것이었다.

오프라인 평가에서 SWE-1은 앤트로픽 제품군을 비롯한 모든 비최첨단 모델과 오픈웨이트 대안보다 우수한 성능을 보였다. 윈드서프는 대화형 SWE 작업 벤치마크와 엔드투엔드 SWE 작업 벤치마크를 통해 성능을 비교했다. 대화형 SWE 작업 벤치마크는 기존 캐스케이드 세션 중간에서 반쯤 완료된 작업이 있을 때 캐스케이드가 다음 사용자 쿼리를 얼마나 잘 처리하는지 측정한다. 엔드투엔드 SWE 작업 벤치마크는 대화의 처음부터 시작하여 캐스케이드가 선택된 단위 테스트를 통과하여 입력 의도를 얼마나 잘 처리하는지 측정한다.

또한 윈드서프는 대규모 사용자 커뮤니티를 활용한 실제 프로덕션 실험을 통해 오프라인 평가를 보완했다. 사용자당 일일 기여 라인 수와 캐스케이드 기여율을 측정했는데, SWE-1은 이러한 실험에서도 업계 선도적인 성능을 보였다. 윈드서프는 플로우 인식 시스템을 통해 SWE-1을 가능하게 했다고 설명했다. 플로우 인식이란 사용자와 AI 간의 포괄적인 상태가 원활하게 얽혀 있는 것을 의미한다. AI가 하는 모든 것을 인간이 관찰하고 행동할 수 있어야 하며, 인간이 하는 모든 것을 AI가 관찰하고 행동할 수 있어야 한다.

윈드서프는 앞으로 SWE 모델 제품군의 개선 사항에 대해 계속 소식을 전할 계획이며, 사용자에게 최저 비용으로 최고의 성능을 제공하기 위해 더 많은 투자를 할 것이라고 밝혔다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 윈드서프

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
롤 TCG 리프트바운드, T1 우승 기념 컬렉션 공개 (1) 게임메카
대통령배 아마추어 e스포츠 대회, 광주 대표 선발전 모집 게임메카
소프트뱅크, 오픈AI 지분 담보 15조 원 대출 협상 재개…기업 보증 추가 AI matters
구글 탄소배출 1년 새 25% 급증…아마존도 16% 늘었다 (1) AI matters
AI 데이터센터 크루소, 4조 7천억 원 조달 협의…기업가치 46조 원 거론 AI matters
테슬라, 직원 AI 지출 주 31만 원으로 제한…xAI 제품은 예외 AI matters
오픈AI, 미 정부에 지분 5% 제안…66조 원 규모 AI matters
[오늘의 스팀] 새로운 안전지대? 러스트 ‘아파트’ 생겼다 게임메카
소니에 이어, MS도 Xbox에서 실물 디스크 없앤다? 게임메카
[리뷰] 독특한 구성 속 탄탄한 기본기, 에이수스 프로아트 PZ14 IT동아
"10년 타기는 옛 말" 폐차 직전까지 21만km... LPG, 가장 오래 타는 차 오토헤럴드
현대차·기아, 美 상반기 88만대 돌파... 하이브리드로 역대급 기록 오토헤럴드
트럼프, USMCA 연장 거부 '자동차 원산지 규정 강화 가능성' 오토헤럴드
"브레이크 페달 없는 테슬라 나온다" 美 자율주행 규제 대수술 오토헤럴드
기아, 해양 폐플라스틱 EV3 트렁크 매트로 재탄생…오션클린업 협력 확대 오토헤럴드
[EV 트렌드] 'EV9·아이오닉 9 정조준' 테슬라 모델 Y L 미국 판매 시작 오토헤럴드
지커, 유럽서 EREV 카드 '들썩' 전기차 시장 둔화에 전략 수정 오토헤럴드
테슬라 독주·BYD 돌풍…6월 수입차 시장 판도 바꾼 전기차 50% 돌파 오토헤럴드
스텔란티스코리아, 개소세 인하 종료 대응 지프·푸조 7월 특별 프로모션 전개 글로벌오토뉴스
가상 세계에서 태어나는 자동차, 현대차 남양연구소 AMS동을 가다 글로벌오토뉴스
이 시간 HOT 댓글!
1/4