비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 수능 문제 풀었더니… GPT-5.1, 433점으로 1등

2025.11.19. 12:54:04
조회 수
378
4

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

오픈AI(OpenAI)의 최신 대형언어모델(LLM)인 GPT-5.1이 2026학년도 대학수학능력시험에서 450점 만점 중 433점을 획득하며 압도적인 성적을 기록했다. 순천향대학교 컴퓨터소프트웨어공학과 구유겸 학생은 수능 당일 공개된 GPT-5.1을 포함해 오픈AI, 구글(Google), 앤트로픽(Anthropic), xAI, 딥시크(DeepSeek)의 최신 LLM 15종을 대상으로 실제 수능 문제를 풀게 한 실험 결과를 깃허브(GitHub)에 공개했다.

실험은 국어, 수학, 영어, 한국사에 물리Ⅰ과 화학Ⅰ까지 포함해 총 450점 만점 기준으로 진행됐다. 각 모델에는 문제의 전체 텍스트가 주어졌으며, 선택형 문항은 보기 중 하나를 고르게 하고 단답형은 정확한 숫자 입력을 요구하는 방식으로 실제 수험 환경을 구현했다.

GPT-5.1은 국어에서 98점, 수학 만점, 영어 만점을 기록하며 전 과목에서 고른 강세를 보였다. 특히 수학 영역에서는 앤트로픽의 클로드 소넷 4.5(Claude Sonnet 4.5)와 함께 만점을 받으며 뛰어난 연산 능력을 입증했다.

구글의 제미나이 2.5 프로(Gemini 2.5 Pro)는 417.7점으로 3위를 차지했다. 국어에서 99점으로 최고 성적을 기록했고, 화학Ⅰ에서도 47점을 받으며 우수한 성능을 보였다. GPT-5.1 코덱스(Codex)는 421점으로 2위에 올랐다.

반면 구형 모델인 GPT-4o는 291.8점으로 최하위권에 머물렀다. 특히 수학에서 56.3점, 화학Ⅰ에서 11점을 받으며 최신 대형 모델과 큰 격차를 보였다.

한국사 영역에서는 다수의 모델이 만점을 기록한 반면, 물리Ⅰ에서는 GPT-5.1도 38점에 그쳤다. 이는 LLM이 지식 기반 암기 영역에서는 강점을 보이지만, 복잡한 추론을 요구하는 문제 해결에는 여전히 한계가 있음을 보여준다.



해당 기사에 인용한 AI 수능 문제 풀이 결과는 깃허브에서 확인 가능하다.

이미지 출처: 순천향대학교 컴퓨터소프트웨어공학과 구유겸 학생




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
스팀에서도 세기말 쿠팡맨 되어보자, ‘데스 스트랜딩 2’ 오는 3월 PC 출시 게임동아
"우리우리 설날은 연휴래요~" 넥슨, 모바일게임 7종 설 맞이 이벤트 진행 게임동아
[이구동성] 밑 빠진 독에 구멍 두 개 더 게임메카
“설 선물도 K-전통이 대세”…식품업계, 한복·한과·보자기 입고 소비자 공략 뉴스탭
영화 원작부터 오디오웹소설까지… 설 연휴 ‘정주행’ 책임질 콘텐츠는? 뉴스탭
설 맞아 최대 50% 할인…더네이쳐홀딩스, 브랜드별 파격 혜택 쏜다 뉴스탭
설 연휴 스타필드 하남에 뜬 BYD…씨라이언 7부터 돌핀까지 총출동 뉴스탭
서울시·월드비전, 기후위기 취약아동 통합지원 나선다…‘햇살가득 꿈가득’ 7억 원 투입 뉴스탭
“설 급찐살은 2주 안에 빼라”…삼천리자전거, 체지방 잡는 투 트랙 루틴 공개 뉴스탭
미송자의 노래, 신규 영웅 '에이르' 더한 대규모 업데이트 게임메카
레메디 신작 '컨트롤 레조넌트' 상세 플레이 정보 공개 (1) 게임메카
전기요금 최대 40% 지원…오텍캐리어, 1등급 냉난방기로 소상공인 부담 던다 뉴스탭
스토케, 2026 서울리빙디자인페어 참가…‘레몬 옐로우’ 트립트랩 국내 최초 공개 뉴스탭
대구 수달·83타워 담았다…배럴, 신세계 대구점서 ‘로컬 한정 수모’ 공개 뉴스탭
“누아르에서 오즈까지”…코치, 뉴욕서 2026 가을 컬렉션으로 ‘미국 패션의 미래’ 제시 뉴스탭
“58년 중식 대가가 버거를 만들면?”…맘스터치, 후덕죽 셰프 컬렉션 3월 출격 (1) 뉴스탭
“설 술상도 ‘헬시 플레저’”…당·퓨린 낮춘 맥주부터 오크 숙성 증류주까지 뉴스탭
10승 신화 잇는다…와이드앵글, 2026 시즌 ‘최정예 7인’ 공개 뉴스탭
전기차로 떠나는 프리미엄 쉼…폴스타, 스테이폴리오와 ‘폴스타 스테이’ 론칭 뉴스탭
프랙탈디자인 사면 무선 헤드셋이 공짜? 서린씨앤아이 2월 한정 이벤트 뉴스탭
이 시간 HOT 댓글!
1/4