비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 수능 문제 풀었더니… GPT-5.1, 433점으로 1등

2025.11.19. 12:54:04
조회 수
72
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

오픈AI(OpenAI)의 최신 대형언어모델(LLM)인 GPT-5.1이 2026학년도 대학수학능력시험에서 450점 만점 중 433점을 획득하며 압도적인 성적을 기록했다. 순천향대학교 컴퓨터소프트웨어공학과 구유겸 학생은 수능 당일 공개된 GPT-5.1을 포함해 오픈AI, 구글(Google), 앤트로픽(Anthropic), xAI, 딥시크(DeepSeek)의 최신 LLM 15종을 대상으로 실제 수능 문제를 풀게 한 실험 결과를 깃허브(GitHub)에 공개했다.

실험은 국어, 수학, 영어, 한국사에 물리Ⅰ과 화학Ⅰ까지 포함해 총 450점 만점 기준으로 진행됐다. 각 모델에는 문제의 전체 텍스트가 주어졌으며, 선택형 문항은 보기 중 하나를 고르게 하고 단답형은 정확한 숫자 입력을 요구하는 방식으로 실제 수험 환경을 구현했다.

GPT-5.1은 국어에서 98점, 수학 만점, 영어 만점을 기록하며 전 과목에서 고른 강세를 보였다. 특히 수학 영역에서는 앤트로픽의 클로드 소넷 4.5(Claude Sonnet 4.5)와 함께 만점을 받으며 뛰어난 연산 능력을 입증했다.

구글의 제미나이 2.5 프로(Gemini 2.5 Pro)는 417.7점으로 3위를 차지했다. 국어에서 99점으로 최고 성적을 기록했고, 화학Ⅰ에서도 47점을 받으며 우수한 성능을 보였다. GPT-5.1 코덱스(Codex)는 421점으로 2위에 올랐다.

반면 구형 모델인 GPT-4o는 291.8점으로 최하위권에 머물렀다. 특히 수학에서 56.3점, 화학Ⅰ에서 11점을 받으며 최신 대형 모델과 큰 격차를 보였다.

한국사 영역에서는 다수의 모델이 만점을 기록한 반면, 물리Ⅰ에서는 GPT-5.1도 38점에 그쳤다. 이는 LLM이 지식 기반 암기 영역에서는 강점을 보이지만, 복잡한 추론을 요구하는 문제 해결에는 여전히 한계가 있음을 보여준다.



해당 기사에 인용한 AI 수능 문제 풀이 결과는 깃허브에서 확인 가능하다.

이미지 출처: 순천향대학교 컴퓨터소프트웨어공학과 구유겸 학생




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 DPG 모아보기 전체 둘러보기
1/1
취미 상품포럼 윈조이포커 멀티가 편해요
취미 상품포럼 파판14 카페 예약 담주 화요일부터 시작인데 기대됨
자유게시판 프로 애국노들
일반뉴스 자동·수동 갈피 못 잡는 아이온2, 또 '모바일 반자동' 추진
일반뉴스 [오늘의 스팀] 리스크 오브 레인 2 신규 DLC ‘압긍’
전문가 리뷰 AI와 오리지널 콘텐츠로 차별화 완료, 로아 모바일 체험기
일반뉴스 "약속 위반" 엔씨, 아이온2 P2W 상품 논란 일자 철회
취미 상품포럼 [방방곡곡 #858] 경주 대릉원 인근 경주 스타벅스 대릉원점
일반뉴스 게임 과금에 '배송 실패'가 웬 말? 아이온2의 미숙한 오픈
일반뉴스 롤·오버워치 2 등 세 종목, 부산 아마추어 대회 결선 예고
일반뉴스 총 상금 1억 원, 2025 KeSPA 컵 6일 개막한다
일반뉴스 발로란트 여성 e스포츠 대회, 20일 서울서 열린다
일반뉴스 2편 포함, '시티즈: 스카이라인' 시리즈 개발사 바뀐다
입소문쇼핑 [알리] LG 32UN650K(32.3만),24GS60F(14.6만),32GS85Q(43만) 24,32인치 4K,나노IPS,게이밍 모니터 블랙프라이데이 특가(11/20~)
자유게시판 빌게이츠 경호원들 전원 해고 사건
일반뉴스 스타세이비어, 라이브 통해 ‘가챠비용’ 영구 할인 발표
ㄷㅂㄷ 과부하된 콘센트에서 불이 나는 이유
일반뉴스 서브컬처·좀비 생존, 위메이드 내년까지 신작 6종 출격
기획뉴스 수능 끝 입시 시작, 게임학과 있는 대학교는 어디?
푸드 상품포럼 [먹거리 소개 #2836] 기사식당 우동과 김밥 (1)
이 시간 HOT 댓글!
1/4