비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

오픈AI, 장시간 코딩에 특화된 ‘GPT-5.1-Codex-Max’ 모델 공개

다나와
2025.11.21. 10:23:53
조회 수
180
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

출처 : 오픈AI


 11월 19일(현지시각), 오픈AI가 복잡하고 장기적인 코딩 과제를 안정적으로 수행할 수 있는 새로운 AI 모델 GPT-5.1-Codex-Max를 공식 출시했다. 이 모델은 소프트웨어 엔지니어링, 수학, 연구 등 에이전트(agent) 역할이 필요한 작업에 최적화된 것이 특징이다. 


 GPT-5.1-Codex-Max는 여러 개의 컨텍스트 창을 동시에 관리할 수 있게 설계되었으며, 이를 위해 자체적으로 정보를 압축하는 콤팩션(compaction) 과정을 도입했다. 이를 통해 수백만 개의 토큰(입출력 단위)을 하나의 과제로 유지하면서도 코드 리팩터링(구조 개선), 디버깅, 반복 작업 등 매우 긴 시간 동안 일관된 작업을 수행할 수 있다. 내부 테스트에서는 24시간 이상 독립적으로 에이전트 루프를 돌리며 오류를 수정하고 기능을 구현하는 모습도 확인되었다. 


출처 : 오픈AI



 또 이전의 GPT-5.1-Codex 대비 “추론 효율성(reasoning efficiency)”이 눈에 띄게 개선되었다. 예컨대, SWE-Bench Verified라는 벤치마크에서 중간 수준의 추론 설정으로도 동일한 성능을 내면서 생각에 사용하는 토큰 수(thinking token)를 약 30% 줄일 수 있었다. 오픈AI가 공개한 벤치마크에 따르면, GPT-5.1-Codex-Max는 이전 버전 대비 성능이 눈에 띄게 향상되어 SWE-Bench Verified 기준 77.9%, SWE-Lancer IC SWE에서는 79.9%, TerminalBench 2.0에서는 58.1%를 기록했다. 


 응답 지연(latency)이 중요하지 않은 작업을 위해 ‘Extra High(xhigh)’라는 새로운 추론 모드도 제공한다. 이 모드는 더 오랜 시간 모델이 “생각”하도록 허용해 더 깊이 있는 결과를 얻는 데 유리하나, 일반적인 용도에는 중간 수준(medium)을 권장한다고 한다. 프론트 엔드(웹 사용자 인터페이스) 코딩 작업에서도 이전 모델과 비슷한 품질을 내며 비용은 낮춘 것으로 설명된다. 


출처 : 오픈AI


 오픈AI는 GPT-5.1-Codex-Max에 다양한 보안 조치를 통합했다. 모델 수준에서는 위험한 요청이나 악용 시나리오에 대응하는 정밀한 안전 훈련을 수행했으며, 제품 수준에서는 샌드박스(sandbox) 실행 환경을 기본으로 제공해 파일 쓰기 제한과 네트워크 접근 통제를 가능하게 했다. 또한 모델이 장시간 동작할 경우 생성된 코드를 개발자가 반드시 검토해야 한다는 권고도 포함돼 있다. 오픈AI 측은 “Codex는 보조 리뷰어 역할이지, 인간 리뷰를 완전히 대체할 수 없다”고 설명한다. 


 GPT-5.1-Codex-Max는 현재 Codex 플랫폼에서 사용 가능하다. CLI(명령줄 인터페이스), IDE(통합 개발환경) 확장, 클라우드, 코드 리뷰 등 다양한 환경을 지원하며, 향후 API(응용 프로그램 인터페이스) 버전도 제공될 예정이다. 또한, ChatGPT Plus, Pro, Business, Edu, Enterprise 플랜 사용자에게 기본 모델로 제공되며, 이전 Codex 모델은 새 버전으로 대체된다.


글 / 김지훈 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
1/1
AWS, 문제 풀 때마다 학습하는 AI 개발... 경험 쌓을수록 저렴하고 정확해 (1) AI matters
AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져 (1) AI matters
"이전 답변 틀렸다" 한마디에 무너지는 AI... 같은 질문도 ‘대화 형식’으로 하면 답 달라져 AI matters
'불수능'이었다는 2026학년도 수능시험, 최신 AI들에게 풀게 한다면? 다나와
'최고의 아첨꾼AI' Grok, “엘론 머스크는 오타니를 제외하면 가장 뛰어나” 다나와
"AI가 버블이라고?ㅋㅋ" 엔비디아, 3분기 실적 '어닝 서프라이즈'...뉴욕증시 급등세로 마감 다나와
오픈AI, 장시간 코딩에 특화된 ‘GPT-5.1-Codex-Max’ 모델 공개 다나와
AI로 곰 출몰 위험 한눈에…日 조치대, 19개 지역 ‘곰 조우 예측 지도’ 공개 다나와
AI에 코딩 도구 주면 정답률 19%↑…풀이 과정은 41% 더 형편없어져 AI matters
챗GPT에게 "어느 나라가 더 나쁜가?" 물었더니... AI도 국가 차별한다 (1) AI matters
긴 문서 속 숨은 해킹 명령어, 이제 AI가 스스로 찾아 차단한다 AI matters
디노티시아, SC25서 VDPU 기반 FPGA로 'AI 반도체' 성능 알린다 IT동아
AI 여러 개 쓰면 답 정확해진다더니... 토큰비용 5배에 정답률은 제자리 AI matters
챗GPT가 원전을 부른다… 데이터센터 전력 수요 폭증에 기업들 원전에 '올인' AI matters
구글 CEO, “AI 맹신 금물”… 급격한 확산 속 과열 우려 제기 다나와
윈도우 11, AI 비서 기능 강화되지만… 새 악성코드 위협도 동반 (1) 다나와
폭스뉴스, 팔란티어와 손잡고 AI 기반 뉴스룸 구축… “미래 뉴스 절반은 AI가 만든다” 전망도 다나와
인도, AI 확산 영향으로 초보 개발자 일자리 최대 25퍼센트 감소 다나와
"AI가 CCTV 속 폭력 포착"... 제미나이가 ‘주먹 드는 순간’ 95% 정확도로 잡는다 AI matters
"챗GPT도 속았다"... AI에게 '답 없는 질문'하자 60% 이상 틀려 AI matters
이 시간 HOT 댓글!
1/4