비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

윈드서프, 코딩 넘어 소프트웨어 엔지니어링 전체 과정 최적화한 'SWE-1' 모델 공개

2025.05.16. 18:37:45
조회 수
310
11

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

윈드서프(Windsurf)가 코딩 작업뿐만 아니라 소프트웨어 엔지니어링 전체 프로세스를 위해 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시했다. 윈드서프는 지난 15일(현지 시간) 자사 블로그를 통해 "오늘 소프트웨어 엔지니어링 전체 과정에 최적화된 첫 번째 모델 제품군 'SWE-1'을 출시한다"고 발표했다.

이번에 출시된 SWE-1 제품군은 세 가지 다른 모델로 구성됐다. 먼저 기본 모델인 'SWE-1'은 앤트로픽(Anthropic)의 클로드 3.5 소넷(Claude 3.5 Sonnet) 수준의 도구 호출 추론 능력을 갖추면서도 더 저렴한 서비스가 가능하다. 이 모델은 프로모션 기간 동안 모든 유료 사용자에게 무료로 제공된다. 중간 크기 모델인 'SWE-1-lite'는 기존의 캐스케이드 베이스(Cascade Base)를 대체하면서 더 나은 품질을 제공한다. 무료와 유료 사용자 모두 무제한으로 사용할 수 있다. 가장 작은 모델인 'SWE-1-mini'는 매우 빠른 속도로 모든 사용자에게 윈드서프 탭(Windsurf Tab) 패시브 경험을 제공한다.

윈드서프는 SWE-1을 개발한 이유에 대해 "소프트웨어 개발 속도를 99% 가속화하는 것이 목표다. 코드 작성은 개발자가 하는 일의 일부분일 뿐이며, '코딩 가능한' 모델만으로는 충분하지 않다"고 설명했다. 윈드서프에 따르면, 지난 몇 년간 코딩 가능한 모델들은 크게 발전했다. 이전에는 짧은 자동 완성 제안을 만드는 정도였던 모델에 대한 기대치가 이제는 한 번에 간단한 애플리케이션을 안정적으로 구축하는 수준으로 높아졌다.

그러나 이러한 모델들이 곧 한계에 도달할 것이라고 윈드서프는 지적했다. 첫째, 소프트웨어 개발자의 모든 시간이 코드 작성에만 소요되는 것은 아니다. 개발자들은 더 많은 유형의 작업을 다양한 환경에서 수행하기 때문에 모델에 대한 기대치가 더 높아져야 한다. 코드를 읽고 쓰는 것뿐만 아니라 터미널에서 작업하고, 다른 지식과 인터넷에 접근하며, 제품을 테스트하고, 사용자 피드백을 이해하는 등 소프트웨어 개발자가 하는 모든 일을 지원해야 한다.

둘째, 소프트웨어 개발 작업은 길고 불완전한 상태로 진행된다. 오늘날 최고의 기반 모델들은 주로 전술적 작업에 집중되어 있다. 그러나 개발자에게 단위 테스트는 더 큰 엔지니어링 문제의 일부일 뿐이다. 오늘 작동하는 기능을 구현하는 방법은 많지만, 향후 몇 년 동안 계속 구축할 수 있는 좋은 방법은 훨씬 적다. 이것이 모델이 사용자의 적극적인 지침과 함께 캐스케이드(Cascade)에서 훌륭한 성능을 보이지만, 독립적으로 작동하는 시간이 길어질수록 성능이 현저히 떨어지는 이유다.

SWE-1은 윈드서프 에디터(Windsurf Editor)의 통찰력을 바탕으로 불완전한 상태, 장기 실행 작업 및 다중 환경을 포함하는 완전히 새로운 데이터 모델(공유 타임라인)과 훈련 레시피를 구축했다. 초기 목표는 연구소보다 적은 엔지니어와 컴퓨팅 파워로도 최신 기술 수준의 성능에 도달할 수 있다는 것을 증명하는 것이었다.

오프라인 평가에서 SWE-1은 앤트로픽 제품군을 비롯한 모든 비최첨단 모델과 오픈웨이트 대안보다 우수한 성능을 보였다. 윈드서프는 대화형 SWE 작업 벤치마크와 엔드투엔드 SWE 작업 벤치마크를 통해 성능을 비교했다. 대화형 SWE 작업 벤치마크는 기존 캐스케이드 세션 중간에서 반쯤 완료된 작업이 있을 때 캐스케이드가 다음 사용자 쿼리를 얼마나 잘 처리하는지 측정한다. 엔드투엔드 SWE 작업 벤치마크는 대화의 처음부터 시작하여 캐스케이드가 선택된 단위 테스트를 통과하여 입력 의도를 얼마나 잘 처리하는지 측정한다.

또한 윈드서프는 대규모 사용자 커뮤니티를 활용한 실제 프로덕션 실험을 통해 오프라인 평가를 보완했다. 사용자당 일일 기여 라인 수와 캐스케이드 기여율을 측정했는데, SWE-1은 이러한 실험에서도 업계 선도적인 성능을 보였다. 윈드서프는 플로우 인식 시스템을 통해 SWE-1을 가능하게 했다고 설명했다. 플로우 인식이란 사용자와 AI 간의 포괄적인 상태가 원활하게 얽혀 있는 것을 의미한다. AI가 하는 모든 것을 인간이 관찰하고 행동할 수 있어야 하며, 인간이 하는 모든 것을 AI가 관찰하고 행동할 수 있어야 한다.

윈드서프는 앞으로 SWE 모델 제품군의 개선 사항에 대해 계속 소식을 전할 계획이며, 사용자에게 최저 비용으로 최고의 성능을 제공하기 위해 더 많은 투자를 할 것이라고 밝혔다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 윈드서프

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
제라드·호이, PGA 투어 배러쿠다 챔피언십 3R 공동 선두 연합뉴스
셰플러, 디오픈 3R 4타 차 선두…임성재 4타 줄여 공동 22위 연합뉴스
호이, PGA 투어 배러쿠다 챔피언십 2R 단독 선두 연합뉴스
국내 야간 영업 골프장 238곳…4년 전 대비 72개소 증가 연합뉴스
미세하게 움직인 공…라우리, 디오픈서 통한의 '2벌타' 연합뉴스
임성재, 디오픈 2R 공동 34위…한국 선수 유일하게 생존 연합뉴스
'아이디어를 시제품제작과 현실 창업으로'··· 서울과기대 학생창업 여정 취재기 IT동아
업스테이지 솔라 프로2 써보니··· '독보적인 OCR 인식률· API 확장성 인상적' IT동아
UAE, 엔비디아 AI 칩 구매 계약 보류… 美 "중국 유출 우려" AI matters
스레드에 AI 기능 도입되나… 메타, 생성형 AI 제품 부사장 ‘스레드 총괄 책임자’로 임명 AI matters
“실감형 미디어 콘텐츠 자동 생성”… 네이버, AI-XR 결합한 '비전 테크 트라이앵글' 공개 AI matters
“사용자 공지 없었다” 앤트로픽, 클로드 코드 사용량 제한 강화 및 변경 논란 AI matters
“명령 한 번에 여러 파일 동시 수정” 구글, 제미나이 코드 어시스트 ‘AI 에이전트’ 모드 출시 AI matters
과기정통부, AI 휴머노이드 핵심기술 개발에 5년간 216억 원 투입한다 AI matters
“사자 포효 소리부터 자연 환경음까지”... 어도비, AI 효과음 제작하는 신기능 베타 출시 AI matters
넷플릭스, 오리지널 드라마에 생성형 AI 최초 활용… “건물 무너지는 장면 구현” AI matters
MSI코리아, 20일 'MSI RTX 50 시리즈 AI 노트북 팝업스토어' 운영 (1) 다나와
MSI '2025 상반기 다나와 히트브랜드 팝업 행사' 참가 다나와
트럼프 대통령, “AI·에너지 인프라에 900억 달러 투자”…미국 산업 재건 본격화 (1) 다나와
KPGA 김태우, 챌린지 투어 첫 우승 연합뉴스
이 시간 HOT 댓글!
1/4