OpenAI가 전문적인 업무 수행을 위한 차세대 프론티어 모델 ‘GPT-5.4’를 공개했다. 이번 모델은 추론 능력과 코딩 성능, 에이전트 기반 워크플로를 하나의 모델로 통합한 것이 특징으로, ChatGPT와 API, 코덱스(Codex) 등 OpenAI의 주요 제품 전반에 적용된다.

GPT-5.4는 특히 GPT-5.3-코덱스의 업계 최고 수준 코딩 능력을 통합하면서 전문 업무 환경에서의 활용성을 크게 개선했다. 스프레드시트, 프레젠테이션, 문서 작업 등 다양한 소프트웨어를 활용하는 실제 업무 환경에서 복잡한 작업을 보다 정확하고 효율적으로 수행할 수 있도록 설계됐다. 이를 통해 사용자가 원하는 결과를 얻기까지 반복적으로 수행해야 했던 작업 과정도 크게 줄일 수 있다.
실제 업무 수행 능력 83% 전문가 수준
성능 측면에서도 GPT-5.4는 주요 벤치마크에서 의미 있는 개선을 보였다. AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제의 83%에서 산업 전문가와 동등하거나 그 이상의 결과를 기록했다. 이는 이전 모델인 GPT-5.2의 71.0% 대비 크게 향상된 수치다.
GPT-5.4 in ChatGPT
GDPval은 미국 GDP의 주요 산업을 대표하는 44개 직군의 업무 과제를 기반으로 모델의 실제 업무 수행 능력을 평가하는 지표다. 이러한 결과는 GPT-5.4가 단순 질의응답을 넘어 실제 업무 환경에서도 활용 가능한 수준의 성능을 확보했음을 보여준다.
OpenAI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다고 설명했다. 투자은행의 주니어 애널리스트가 수행하는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%를 크게 웃돌았다.
프레젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도 등이 향상됐으며 모델의 사실 정확성 역시 개선된 것으로 나타났다.
범용 모델 최초 ‘컴퓨터 사용’ 기능 기본 탑재
GPT-5.4는 OpenAI가 공개한 범용 모델 가운데 컴퓨터 사용(computer-use) 기능을 기본적으로 탑재한 첫 모델이라는 점에서도 주목된다. 코덱스와 API 환경에서는 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 조작하고 여러 애플리케이션을 넘나들며 복잡한 작업 흐름을 수행할 수 있다.
GPT-5.4 in Codex
또한 최대 100만 토큰(1M tokens)의 컨텍스트를 지원해 장시간 작업을 계획하고 실행하며 검증하는 에이전트 시스템 구축에도 적합하다. 이러한 기능은 웹 브라우징, 데스크톱 환경 조작, 멀티모달 이해 등 다양한 벤치마크에서도 높은 성능으로 확인됐다.
ChatGPT에서도 새로운 작업 방식이 도입됐다. 사용자는 ‘GPT-5.4 Thinking’ 모델을 선택해 활용할 수 있으며, 모델이 답변을 생성하기 전에 작업 계획을 먼저 제시하는 방식이 적용된다. 이를 통해 사용자는 응답 생성 과정 중에도 방향을 조정할 수 있어 추가적인 대화를 반복하지 않고도 원하는 결과에 보다 빠르게 도달할 수 있다.
이와 함께 웹 기반 심층 조사 기능도 강화돼 여러 출처의 정보를 종합해야 하는 복잡한 질문에서도 보다 정확하고 일관된 답변을 제공한다.
AI 에이전트 업무 자동화 기반 확대
GPT-5.4는 대규모 도구 환경에서도 효율적으로 작동하도록 ‘도구 검색(tool search)’ 기능을 새롭게 도입했다. 이를 통해 에이전트는 다양한 도구와 커넥터가 연결된 환경에서 필요한 도구를 정확하게 찾아 사용할 수 있으며, 토큰 사용량과 응답 지연도 줄일 수 있다.
또한 GPT-5.4는 GPT-5.2 대비 문제 해결에 필요한 토큰 수를 크게 줄인 가장 효율적인 추론 모델로, 동일한 작업을 더 빠르고 비용 효율적으로 수행할 수 있도록 설계됐다.
OpenAI는 이번 GPT-5.4 출시를 통해 기업과 전문가들이 복잡한 업무를 보다 빠르고 정확하게 처리할 수 있을 것으로 기대하고 있다. 특히 AI 에이전트를 활용한 새로운 업무 방식이 확산되면서 다양한 산업 분야에서 생산성 혁신이 가속화될 것으로 전망된다.
이준문 기자/jun@newstap.co.kr
ⓒ 뉴스탭(https://www.newstap.co.kr) 무단전재 및 재배포금지
[뉴스탭 인기 기사]
· 애교살 볼륨 한 번에… 3CE, ‘아이 스위치 스틱’으로 색조 시장 정조준
· 국제수영연맹 인증 획득한 배럴 ‘엣지 레이서’…시야·밀착감·저항까지 잡았다
· 극장판 개봉 맞춰 ‘하사웨이 노아’ 전원 지급… SD건담 지 제네레이션 이터널, 최대 다이아 4000개 제공
· 비는 막고 땀은 빼고…K2, 세계 최초 하이브리드 고어텍스 하이킹화 출시
· DDR5 가격 폭등 속 대안? PATRIOT DDR5-6000 CL30 SIGNATURE PREMIUM EVO




3