오픈AI, GPT-4.1 신규 모델 출시… 코딩 성능 및 지시 수행 능력 대폭 향상 : 다나와 DPG는 내맘을 디피지

오픈AI가 14일(현지 시간) 코딩 성능과 지시 수행 능력이 크게 향상된 새로운 AI 모델 시리즈인 GPT-4.1을 API를 통해 출시했다. 이번에 선보인 모델은 GPT-4.1, GPT-4.1 미니, GPT-4.1 나노로 구성되어 있으며, 이전 모델인 GPT-4o 대비 전반적인 성능 향상과 함께 100만 토큰까지 처리 가능한 대규모 컨텍스트 창을, 그리고 2024년 6월까지의 지식을 보유하고 있다.

GPT-4.1은 코딩 분야에서 특히 두드러진 성능 개선을 보였다. 실제 소프트웨어 엔지니어링 능력을 측정하는 SWE-bench Verified에서 54.6%의 점수를 기록했는데, 이는 GPT-4o의 33.2%보다 21.4%p 높은 수치다. 로이터에 따르면, 오픈AI는 새 모델이 웹앱 제작, 코드 수정, 정확한 diff 형식 생성 등에서 이전보다 훨씬 뛰어난 성능을 보인다고 발표했다. 윈드서프(Windsurf)는 자체 코딩 벤치마크에서 GPT-4.1이 GPT-4o보다 60% 높은 점수를 기록했다고 밝혔다. 사용자들은 도구 호출에서 30% 더 효율적이며, 불필요한 편집을 반복할 가능성이 약 50% 낮아졌다고 평가했다.

GPT-4.1은 지시 수행 능력에서도 큰 향상을 보였다. 다양한 지시 사항을 따르는 능력을 측정하는 Scale의 MultiChallenge 벤치마크에서 GPT-4.1은 38.3%를 기록했는데, 이는 GPT-4o보다 10.5%p 높은 수치다. 법률 AI 보조 도구인 CoCounsel을 개발한 톰슨 로이터(Thomson Reuters)는 GPT-4.1을 통해 다중 문서 검토 정확도가 17% 향상되었다고 밝혔다. 특히 여러 출처 간 맥락을 유지하고 문서 간 미묘한 관계를 정확하게 식별하는 능력이 뛰어나다고 평가했다.

GPT-4.1 시리즈는 모두 최대 100만 토큰의 컨텍스트를 처리할 수 있다. 이는 이전 GPT-4o 모델의 12만 8,000 토큰에서 크게 증가한 수치로, 8개의 React 코드베이스 전체를 처리할 수 있는 용량이다. 오픈AI에 따르면, GPT-4.1은 긴 컨텍스트에서도 관련 정보를 발견하고 사소한 내용은 무시하는 능력이 이전 모델보다 훨씬 뛰어나다. 특히 비디오 이해 벤치마크인 Video-MME에서 72.0%의 점수를 기록해 GPT-4o의 65.3%보다 6.7%p 높은 결과를 보였다.

GPT-4.1 시리즈는 이미지 이해 능력에서도 강점을 보였다. 특히 GPT-4.1 미니는 이미지 벤치마크에서 종종 GPT-4o를 능가하는 성능을 보였다. 가격 측면에서는 효율성 개선을 통해 이전보다 낮은 가격에 제공된다. GPT-4.1은 GPT-4o보다 평균 26% 저렴하며, GPT-4.1 나노는 오픈AI의 가장 저렴하고 빠른 모델로 출시됐다. 현재 모든 개발자가 이용할 수 있다.

오픈AI의 알파 테스터들은 실제 환경에서 GPT-4.1의 성능을 검증했다. 법률 전문 AI 도구를 개발하는 블루 제이(Blue J)는 GPT-4.1이 자사의 가장 까다로운 실제 세금 시나리오에 대한 내부 벤치마크에서 GPT-4o보다 53% 더 정확했다고 보고했다. 데이터 분석 플랫폼 헥스(Hex)는 GPT-4.1이 자사의 가장 어려운 SQL 평가 세트에서 거의 2배 향상된 성능을 보였다고 발표했다. 모델이 대규모 모호한 스키마에서 올바른 테이블을 선택하는 데 더 신뢰할 수 있었다는 점이 특히 주목할 만하다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 오픈AI

기사는 클로드와 챗gpt를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

딥엑스, 라즈베리파이 5용 AI 모듈 출시··· '고래 싸움 대신 정어리 떼 잡는다' (1)	IT동아
마녀가 빵집 운영하는 '위치스 베이커리' 8월 출시 (2)	게임메카
중세 판타지 생존게임 인슈라오디드, 10월 정식 출시 (1)	게임메카
MSI, AI 환경 완성하는 ‘MAG 코덱스 Z2’ 게이밍 데스크탑 출시	다나와
서린씨앤아이, 어페이서 PCIe Gen5 인터페이스 지원 AS2280F4L M.2 NVMe 1TB 출시	다나와
마이크로닉스 '이터널 리턴 쁘띠 미뇽 스페셜 에디션 PC' 출시	다나와
알파스캔, 업무·학습·일상 업그레이드하는 27형 QHD 모니터 ‘AOC Q27B30E’ 출시 (1)	다나와
타입문 '월희' 리메이크 한국어판, 8월 13일 출시 (1)	게임메카
탐론, 니콘 Z·캐논 RF용 APS-C 표준 줌 렌즈 7월 2일 출시	뉴스탭
아틱 ‘P12 프로’ 국내 출시…저소음·고풍압·제로 RPM 지원	뉴스탭
플레이스테이션 헤리티지 담았다, ‘아이콘 블루’ 듀얼센스 7월 국내 출시	뉴스탭
서린씨앤아이, 읽기 10,400MB/s Gen5 SSD ‘어페이서 AS2280F4L’ 출시	뉴스탭
서린씨앤아이, 저소음 쿨링팬 '아틱 P12 프로 시리즈' 출시	다나와
다크플래쉬, BM-07C 이동식 TV 모니터 거치대 스탠드 출시 (1)	다나와
[신차공개] 토요타 ‘올 뉴 RAV4’ 출시·폭스바겐 ‘2026년형 ID.5’ 고객 인도 시작 (1)	IT동아
바이트댄스, 30초 4K 한 번에 뽑는 ‘시댄스 2.5’ 기습 공개… 7월 정식 출시	AI matters
BMW 7시리즈 블랙 트림 출시 '더 고급스럽고 더 강렬해진 외관'	오토헤럴드
스냅, 약 337만원짜리 AR 안경 ‘스펙스’ 출시… 오픈AI·제미나이 기본 탑재 (1)	AI matters
방치형 게임 데스크톱 메이트 '키즈나 아이' DLC 30일 출시 (1)	게임메카
마이크로닉스, 최대 3600W 그레이트월 CRPS로 AI 서버 전원 시장 공략 (1)	뉴스탭
강화유리 곡선 디자인에 오렌지 컬러 입힌 HYTE X50 국내 출시 (1)	뉴스탭
코렐, 여름 식탁 겨냥한 ‘코티지 바인’ 출시…블루 플라워로 청량감 더했다 (1)	뉴스탭
엡손, 협소 공간 정밀작업 겨냥 6축 로봇 ‘CX-A 시리즈’ 출시 (1)	뉴스탭
오텍캐리어, 장마철 겨냥 ‘인버터 제습기’ 출시…최대 29L 제습 성능	뉴스탭
필립스, 국내 최초급 34인치 5K2K 듀얼모드 USB-C 도킹 모니터 ‘34B2U5900C’ 출시	다나와
아이노비아, 여름철 물놀이·캠핑 필수 아이템 휴대용 에어펌프 ‘비레스트 NOVA PUMP’ 출시	다나와
서린씨앤아이, 미들타워 케이스 '하이트 X50' 및 시스템 팬 '플로우 FA12 아스트랄 오렌지' 출시	다나와
8세대 아반떼 '괴력'까지 갖춘다... 트레일러 견인 테스트 장면 포착	오토헤럴드
이베코, 대형 트랙터 올 뉴 S-Way 출시 '580마력·연비 10% 향상'	오토헤럴드
벤틀리, 색으로 완성한 럭셔리 정점 100대 한정판 '비스포크 시리즈' 공개	오토헤럴드
밸브 ‘스팀 머신’ 가격 공개, 최저가 161만 원	게임메카
크로스오버, 32인치 QHD 100Hz '크로스오버존 32QV9 WQHD USB TYPE-C 블랙 화이트' 출시 (1)	다나와
서린씨앤아이 '써멀라이트 M.2 NVMe SSD 인클로저 HR-EB' 시리즈 3종 출시	다나와
오성오에스씨, 배터리로 쓰는 40V 브러시리스 예초기 내놨다	뉴스탭
크로스오버, 32형 QHD 100Hz 모니터 ‘32QV9’ 출시 (1)	뉴스탭
풀무원, 서리태 콩물로 여름 시장 공략…특등급 국산콩 라인업 확대 (1)	뉴스탭
필립스 첫 34형 5K 듀얼모드 모니터 출시…업무와 엔터테인먼트 한 화면에	뉴스탭
4K·8K 스트리밍부터 스마트홈까지…넷유, AX3000급 기가 공유기 선보여	뉴스탭
데이지와 토이 스토리가 만났다…케이스티파이 한정 컬렉션 24일 출시	뉴스탭
델, 랙당 GPU 144개 탑재 AI 서버 공개…차세대 HPC 시장 정조준	뉴스탭
제이씨현시스템, 오버클럭 퍼포먼스 높인 '기가바이트 B850M FORCE V2' 메인보드 출시 (1)	다나와
서린씨앤아이 '아틱 P12 프로 리버스 블랙' 쿨링 팬 출시 (2)	다나와
알파스캔, FPS·발로란트 유저 위한 260Hz 게이밍 모니터 ‘AOC 24G50Z’ 출시 (1)	다나와
크로스오버, 27형 QHD 120Hz 모니터 출시…무결점 업그레이드 행사 진행 (2)	뉴스탭
파네라이, 네이비 씰 휘장 새긴 500m 다이버 워치 공개 (2)	뉴스탭
셀프타이머 품은 인스탁스 미니 13, 즉석카메라 촬영 방식 넓힌다	뉴스탭
슬립오버, 첫 냉감 침구 라인 출시…여름 숙면 시장 공략	뉴스탭
24형에 260Hz 담았다… 알파스캔, FPS 특화 AOC 24G50Z 출시	뉴스탭
서울드래곤시티, 복날 겨냥 ‘흑화고 토종 삼계탕’ 온라인 출시 (2)	뉴스탭
회수다옥, 제주 차 문화 들고 직접 찾아간다…프리미엄 케이터링 ‘마중차림’ 출시	뉴스탭
최대 3000RPM 고성능 쿨링 팬, 아틱 P12 PRO Reverse PST 블랙 국내 출시	뉴스탭
680마력 하이브리드 품은 벤틀리 S, 컨티넨탈 GT·GTC S 국내 상륙	뉴스탭
구글 제미나이 3.5 프로, 6월 출시 약속 마감 임박…9일 남았다 (1)	AI matters
'현대차 코나'는 진화 중... '동글이에서 각짐으로' 완전 변경 선택	오토헤럴드
델 XPS·에일리언웨어 신제품 6종 공개, AI PC부터 5K OLED까지 총공세	뉴스탭
캐논, 7K RAW 담는 풀프레임 영상 카메라 ‘EOS R6 V’ 19일 출시	뉴스탭
향으로 덮지 않는다…불스원, 냄새 분자 잡는 무향 탈취제 출시 (1)	뉴스탭
삿포로 70, 출시 1년 만에 수입 라이트 맥주 시장 1위 굳혔다 (2)	뉴스탭
당 함량 6g으로 낮췄다…풀무원헬스케어, 식물성유산균 음료 새단장	뉴스탭
MSI, 맥북 사용자 겨냥한 27형 4K QD-OLED 모니터 출시	뉴스탭
선 정리 부담 줄인 쿨링팬, 써멀라이트 TL-M12 시리즈 국내 출시	뉴스탭
초콜릿에 단백질 8.5g 담았다…키토선생 ‘로코초코 프로틴볼’ 출시	뉴스탭
펄사, 스텔라이브 협업 마우스 공개…6월 19일부터 한정 예약 판매	뉴스탭
수이 기반 첫 은행 발행 스테이블코인 인프라 출시	뉴스탭
코파일럿이 ‘답변’을 넘어 ‘업무 완성’까지…MS, 코워크 전 세계 출시	뉴스탭
120kg 자재도 전동 흡착으로 든다…디월트, 현장 리프팅 신제품 출시	뉴스탭
서린씨앤아이, 무선 스플라이싱 구조 적용 '써멀라이트 쿨링 팬 TL-M12' 시리즈 출시 (2)	다나와
델 테크놀로지스, 차세대 XPS 및 ‘에일리언웨어’ 게이밍 신제품 6종 공개 (2)	다나와
프리오텍 '지우샥 JF160R Quiet RGB' 및 'JF160R Quiet ARGB' 출시 (2)	다나와
로지텍, 햅틱 피드백 및 디지털 하이라이팅 기능의 프리미엄 프리젠터 ‘Spotlight 2’ 출시 (1)	다나와
MSI, M-Mate로 MacBook 연동 강화한 ‘PRO MAX 271UPXW12G’ 출시	다나와
서린씨앤아이 'AGI AI858' 및 'AI298 M.2 NVMe SSD' 출시	다나와
크로스오버, 27인치 나노IPS 블랙 4면 제로 120Hz 모니터 출시 및 기념 행사 (1)	다나와
680마력 괴물 하이브리드, 벤틀리 '더 뉴 컨티넨탈 GT SㆍGTC S' 출시	오토헤럴드
대원씨티에스, AMD B650 기반 M-ATX 메인보드 ‘ASRock B650M Pro-A Gen5’ 출시 (1)	다나와
앱코, LCD 디스플레이 탑재 ‘UD51L 엑시드 LCD’ PC 케이스 출시 (1)	다나와
디앤디컴, PCIe 5.0 인터페이스 지원 ‘ASRock B650M Pro-A Gen5’ 출시	다나와
와이드뷰, 55인치 '더 프리미엄 화이트 이젤스탠드 세트 QLED 4K UHD 구글 스마트 TV' 출시	다나와
서린씨앤아이, 써멀라이트 일체형 프레임 쿨링팬 TL-UB 시리즈 8종 출시	다나와
MSI, 4K UHD 165Hz QD-OLED 게이밍 모니터 2종 출시	다나와
로지텍, 혁신적인 폴딩 구조와 초경량 무게 포켓 사이즈 폴더블 마우스 ‘MOBI FOLD’ 출시	다나와
파인디지털, 디지털 룸미러·PBV 차량 맞춤형 블랙박스 ‘파인뷰 LXQ EX’ 출시	다나와
인스타360 루나 울트라 출시! 라이카 렌즈 탑재, 8K 등등 역대급 짐벌 카메라 스펙 총정리 (1)	다나와
"가상 변속까지 넣었다" 포르쉐, 더 감성적인 2027년형 타이칸 공개	오토헤럴드
BMW 미래가 달린 첫 번째 전기차, 노이어 클라쎄 'iX3' 국내 상륙	오토헤럴드
현대적 감성 반영한 '에버퀘스트 레전드' 7월 28일 출시 확정	게임메카
[IT신상공개] "컬·스트레이트 하나로" 다이슨, '에어랩 코안다2x' 업그레이드 버전 한국 첫 공개 (1)	IT동아
디앤디컴, 인텔 B860 칩셋 기반 메인보드 ‘ASRock B860M ROCK WIFI’ 출시	다나와
서린씨앤아이 'HYTE tokidoki hololive English Advent 콜라보레이션 에디션' 3종 출시 (4)	다나와
포드, 초대형 SUV '올 뉴 익스페디션' 출시... 가격 1억 2350만 원 (1)	오토헤럴드
전원 어댑터 없는 외장하드, Seagate One Touch Desktop USB BUS Power 데이터복구 8TB [이달의 신제품] (7)	다나와
클라이브 바커스 헬레이저 리바이벌 10월 8일 출시	게임메카
필립스코리아, 저소음 가정용 산소발생기 ‘옥시저네이트 5’ 출시 (3)	뉴스탭
A4보다 작은 바닥 면적에 하루 21.7L 제습…쿠쿠, 인스퓨어 슬림 제습기 공개	뉴스탭
젠하이저, 중·대형 회의실용 천장형 마이크 ‘TCC M 플러스’ 출시	다나와
제이씨현시스템, 퍼포먼스 중심 게이밍 메인보드 '기가바이트 B850M GAMING X WIFI6E' 출시	다나와
여름 언더웨어도 ‘초경량’ 경쟁…감탄, 에어랩 2.0 출시 (2)	뉴스탭
“조끼에 팬·배터리·아이스팩까지”…K2, 여름 냉감 베스트 출시	뉴스탭
0.03ms 응답속도에 OLED 번인 보증까지…MSI 신형 모니터 공개 (1)	뉴스탭
에이수스, T1 담은 RTX 50 그래픽카드 출시…5060 Ti·5070 한정판 공개	뉴스탭

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

오픈AI, GPT-4.1 신규 모델 출시… 코딩 성능 및 지시 수행 능력 대폭 향상

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

오픈AI, GPT-4.1 신규 모델 출시… 코딩 성능 및 지시 수행 능력 대폭 향상

공유하기

공감/비공감