네이버·KAIST가 발견한 AI 학습 비밀? 50% 난도로 훈련하면 성능 10배 향상 : 다나와 DPG는 내맘을 디피지

Online Difficulty Filtering for Reasoning Oriented Reinforcement Learning

AI가 수학 문제를 잘 풀 수 있게 훈련시키려면 어떤 문제를 주는 것이 좋을까? 네이버 클라우드(NAVER Cloud)와 KAIST AI 연구진이 답을 찾았다. AI가 절반 정도 맞힐 수 있는 중간 난이도 문제로 훈련시키면 학습 효과가 가장 좋다는 것이다. 이를 '균형 온라인 난이도 필터링(Balanced Online Difficulty Filtering)'이라고 부르며, AI 모델이 현재 수준에서 50% 정도 맞출 수 있는 문제들만 골라서 훈련에 사용한다.

AI 학습에서는 사람처럼 단계별로 어려운 문제를 차근차근 배우는 것이 중요하다. 너무 쉬운 문제는 새로 배울 것이 없고, 너무 어려운 문제는 도저히 풀 수 없어서 포기하게 된다. 마치 중학생에게 대학 수학 문제를 주거나 초등학교 산수 문제를 주는 것과 같다. 연구진은 수학적 분석을 통해 AI가 50% 정도 맞힐 수 있는 문제가 학습에 가장 도움이 된다는 것을 증명했다.

가장 어려운 수학 시험에서 10% 더 높은 점수 달성

해당 연구 논문에 따르면, 이 새로운 방법으로 AI를 훈련시킨 결과, 기존 방법보다 평균 4% 더 좋은 성과를 거뒀다. 특히 미국의 가장 어려운 수학 경시대회인 AIME(American Invitational Mathematics Examination)에서는 무려 10% 포인트나 더 높은 점수를 받았다. 이는 마치 평소 60점 받던 학생이 갑자기 70점을 받게 된 것과 같은 큰 향상이다.

연구진은 Qwen2.5-3B라는 AI 모델을 사용해서 5가지 서로 다른 수학 시험으로 실험했다. 기존 방법들은 미리 정해진 순서대로 쉬운 문제부터 어려운 문제까지 차례로 풀게 했지만, 새로운 방법은 실시간으로 AI의 실력을 파악해서 딱 맞는 난이도의 문제만 골라준다. AI가 문제를 16번 풀어본 결과를 보고 통과율을 계산한 다음, 25%에서 75% 사이로 맞힐 수 있는 문제들만 다음 훈련에 사용한다.

훈련 시간을 절반으로 줄이면서도 더 좋은 결과

이 방법의 가장 큰 장점은 훈련 시간과 비용을 크게 줄일 수 있다는 것이다. 기존 방법으로 100일 걸리던 훈련을 60일 만에 끝낼 수 있으면서도 더 좋은 성과를 낼 수 있다. AI 훈련에는 엄청난 전기료와 컴퓨터 비용이 들기 때문에 이런 효율성 향상은 매우 중요하다.

연구 결과, 너무 쉽거나 너무 어려운 문제들을 모두 제거하는 균형 잡힌 방법이 한쪽만 제거하는 방법보다 훨씬 효과적이었다. 마치 운동할 때 너무 가벼운 무게로도 너무 무거운 무게로도 근육이 늘지 않는 것처럼, AI도 적당한 난이도의 문제로 훈련해야 실력이 늘어난다. 연구진의 분석에 따르면 100% 맞히거나 0% 맞히는 문제들은 AI가 새로 배울 것이 전혀 없어서 시간 낭비일 뿐이다.

AI 실력이 늘면 자동으로 더 어려운 문제 제공

이 방법의 또 다른 신기한 점은 AI가 실력이 늘어갈수록 자동으로 더 어려운 문제를 제공한다는 것이다. 처음에는 AI가 절반 정도 맞힐 수 있는 비교적 쉬운 문제들로 시작하지만, 훈련이 진행되면서 AI의 실력이 늘어나자 더 어려운 문제들이 자연스럽게 훈련 세트에 포함됐다. 이는 마치 게임에서 레벨이 올라갈수록 더 강한 몬스터가 나타나는 것과 비슷하다.

실험에서 사용한 방법은 여러 개의 문제를 동시에 처리할 수 있도록 설계돼서 훈련 과정이 안정적이고 빨랐다. 각 문제를 몇 번씩 풀어봤는지 기록해서 같은 문제를 반복하지 않도록 하고, 정해진 개수의 문제가 모이면 바로 훈련을 시작할 수 있도록 만들어졌다.

FAQ

Q: 왜 50% 정도 맞히는 문제가 학습에 가장 좋은가요?

A: 사람이 공부할 때도 너무 쉬우면 배울 게 없고 너무 어려우면 포기하게 되는 것처럼, AI도 마찬가지입니다. 50% 정도 맞힐 수 있는 문제는 AI가 노력하면 풀 수 있으면서도 새로운 것을 배울 수 있는 딱 좋은 난이도입니다.

Q: 이 방법이 기존 방법보다 왜 더 효과적인가요?

A: 기존 방법은 미리 정해진 순서대로 문제를 주지만, 새로운 방법은 AI의 현재 실력을 실시간으로 파악해서 딱 맞는 난이도의 문제만 골라줍니다. 덕분에 가장 어려운 수학 시험에서 10% 더 높은 점수를 받을 수 있었습니다.

Q: 실제로 어떤 분야에서 이 기술을 사용할 수 있나요?

A: 수학 문제를 푸는 AI, 논리적 추론이 필요한 AI, 복잡한 문제 해결 AI 등을 만들 때 사용할 수 있습니다. 훈련 시간과 비용을 절반으로 줄이면서도 더 좋은 성능의 AI를 만들 수 있어서 매우 실용적입니다.

해당 기사에 인용한 논문 원문은 arvix에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[오늘의 스팀] 한 주 동안 판매 1위, '바하 레퀴엠' 출시 코앞	게임메카
2026 VCT 첫 국제전, 마스터스 산티아고 3월 1일 열린다	게임메카
처치 곤란했던 폐가전, 스티커 없이 무료 배출하는 방법	IT동아
BMW 모토라드, 15대 한정판 ‘BMW R 12 S’ 국내 출시	글로벌오토뉴스
BMW 코리아 미래재단, 대학생 사회공헌 공모전 ‘영 이노베이터 드림 프로젝트’ 개최	글로벌오토뉴스
틸 셰어 폭스바겐그룹코리아 사장, 한국수입자동차협회(KAIDA) 회장 3연임	글로벌오토뉴스
[영상] 영국 두 아이콘의 만남, MINI 폴 스미스 에디션을 만나다	글로벌오토뉴스
소파가 전시 오브제로…알로소, ‘서울리빙디자인페어’서 체험형 공간 선보여	뉴스탭
“집이 곧 필드”…텔몬파크골프, 가정용 시뮬레이터로 시장 판 바꿨다	뉴스탭
“아이마다 다른 공부 리듬”…일룸, 체험형 팝업으로 학생방 새 기준 제시	뉴스탭
바나나·파인애플·용과의 변신…야외 미식 트렌드 ‘밖슐랭’ 확산	뉴스탭
이채민과 함께한 K2 2026 SS 화보 공개…기능성과 스타일 모두 잡았다	뉴스탭
이동휘의 ‘스피드 무드’ 통했다…버커루 2026 S/S 캠페인 공개	뉴스탭
36년 만의 블러드문 뜬다…식품·유통업계, 정월대보름 마케팅 ‘후끈’	뉴스탭
뷔의 담백한 무드로 완성한 ‘일상 아웃도어’…스노우피크 26 스프링 컬렉션 공개	뉴스탭
“노래 들으며 타자 연습”… 코르티스 신곡 가사 ‘타자 게임’으로 최초 공개	뉴스탭
3천원대 마요부터 단백질 강화 메뉴까지…도시락 시장, 초개인화 경쟁 본격화	뉴스탭
코지마 감성 입은 ROG, ‘루덴스’ 철학 담은 한정판 Z13 전격 공개	뉴스탭
한예슬 효과 통했다…세르본 ‘튜닝엑스’, 면세점·백화점 온라인몰 전격 입점	뉴스탭
“상금 2억2000만원” 구글 딥마인드, 서울서 ‘제미나이 3’ 해커톤 연다	뉴스탭
250야드 장타자 이슬기2, 에이븐 입고 KLPGA 정규투어 도전장	뉴스탭
묘하게 닮은 ‘일곱 개의 대죄: 오리진’과 ‘붉은사막’ 3월 맞대결	게임동아
웹젠 '뮤: 포켓 나이츠', 신규 유물 등 육성 콘텐츠 업데이트	게임동아
넷마블 '일곱 개의 대죄: 그랜드 크로스', 글로벌 서비스 6주년 페스티벌	게임동아
스마일게이트 ‘카제나’, 센서타워 APAC 어워즈 ‘최고의 신규 서브컬처 게임’ 선정	게임동아
엔씨(NC) '리니지 클래식', 비정상 플레이 근절 박차.. '클린 캠페인' 진행	게임동아
스마일게이트-GRID, ‘크로스파이어’ e스포츠 공식 데이터 글로벌 유통 파트너십 체결	게임동아
타타대우, 특장업체 사이버보안 설명회 '상용차 보안' 선제 대응	오토헤럴드
GMC 허머 EV, 국내 인증 완료 '복합 512km 기록' 상반기 판매 돌입	오토헤럴드
현대차·기아, 전기차 배터리관리시스템·BMW 스타터 모터 결함 리콜	오토헤럴드
EU 1월 신차 판매 3.9% 감소, 현대차 22.2% 급감 기아와 순위 역전	오토헤럴드
'20만대 시대는 옛말' 아우디, 美 판매 2년 연속 역성장 이어 추가 감소	오토헤럴드
“표지판 번쩍임 줄인다” 테슬라 매트릭스 라이트 개선 예고	오토헤럴드
'크로스오버 대신 픽업' 현대차, 美 시장 전략 전환 가속	오토헤럴드
특별한 감성 미니 전기차. MINI 쿠퍼 SE 폴 스미스 에디션 출시	오토헤럴드
'임직원 긍정 응답 79%' 기아, 대한민국 일하기 좋은 100대 기업 선정	오토헤럴드
KG모빌리티 '이스타나' 출시, 상용·다목적 라인업 강화 시동	오토헤럴드
'음악으로 이어진 아산의 정신' 현대차그룹, 25주기 추모 행사 개최	오토헤럴드
'하루 6000원이면 탄다' BYD, 中 내수 둔화에 파격 조건 내놔	오토헤럴드
한국수입자동차협회, 제17대 회장에 틸 셰어 재선임… 3연속 선임	오토헤럴드
현대차그룹, 새만금에 10조 원 규모 미래 산업 기지 조성	글로벌오토뉴스
렉서스 IS, 1,000km 주행 앞세워 2027년 배터리 전기차로 부활	글로벌오토뉴스
중국 창안자동차, 1,500km 주행 전고체 배터리 내년 시험 탑재... 2027년 양산	글로벌오토뉴스
웨이모, 미 4개 도시 추가 확장… 무인 로보택시 10개 도시 시대 개막	글로벌오토뉴스
랜드로버, 디펜더 스포츠 EV 올 해 말 공개… 6천만 원대 전기 오프로더 시장 정조준	글로벌오토뉴스
르노 앙페르-바스퀘볼트 협력… 차세대 리튬 금속 배터리 검증 가속화	글로벌오토뉴스
중국 지커, 이탈리아 진출로 유럽 공략 가속화… 2분기 인도 시작	글로벌오토뉴스
중국 체리자동차, 영국에 네 번째 브랜드 레파스 론칭… 플래그십 L8 내년 3분기 상륙	글로벌오토뉴스
BMW M, 유로 7 선제 대응… M5·XM 성능 최적화 모델 내년 상륙	글로벌오토뉴스
폴스타, 유럽서 그리드 보상 확대… 차량 제어 스마트 충전으로 유지비 절감	글로벌오토뉴스
토요타코리아, ‘제19회 토요타 드림카 아트 콘테스트’ 국내 예선 시상식 개최	글로벌오토뉴스
현대차그룹, 정주영 창업회장 서거 25주기 추모 음악회 개최	글로벌오토뉴스
기아, ‘대한민국 일하기 좋은 100대 기업’ 선정	글로벌오토뉴스
오토노머스에이투지, ‘국가핵심기술’ 자율주행 최초 수출 승인	글로벌오토뉴스
아우디 코리아, KCC 오토그룹 신규 공식 딜러사로 선정	글로벌오토뉴스
MINI 코리아, ‘디 올-일렉트릭 MINI 쿠퍼 SE 폴 스미스 에디션’ 공식 출시	글로벌오토뉴스
메르세데스-벤츠 코리아, 새로운 차량 판매 방식, ‘리테일 오브 더 퓨처’ 협약식 개최	글로벌오토뉴스
KGMC, ‘E-STANA(이-스타나)’ 1호차 인도식 개최	글로벌오토뉴스
뱀서 공식 스핀오프 '워해머 서바이버' 신규 무기 소개	게임메카
남은 티켓은 어디로? T1 LCK CL 플레이오프 결승 직행	게임메카
개발에 집중해온 시프트업, 자체 퍼블리싱 재도전한다	게임메카
도전 예고한 크래프톤, 신규 비전 슬로건 및 CI 공개	게임메카
“완벽한 팬 서비스” 바이오하자드 레퀴엠 메타 88점	게임메카
슈퍼센트 '스네이크 클래시', 센서타워 APAC 어워즈 '최고의 하이퍼캐주얼 게임' 선정	게임동아
엔씨(NC) ‘리니지 클래식’, 동시접속자 32만∙누적 매출 400억 돌파	게임동아
조이시티 ‘프리스타일’, 초코엔터 협업 캐릭터 ‘안판’ 업데이트	게임동아
소닉 레이싱, 용과 같이, 투 포인트 뮤지엄... 세가 게임 할인 중!	게임동아
에이시티게임즈 ‘헬로키티 마이 드림 스토어’, 출시 1년만에 日 양대 마켓 인기 1위	게임동아
‘서든어택', 신규 생존전 ‘시범단지’ 업데이트	게임동아
넥슨의 좀비 생존 신작 ‘낙원’ 3월 12일 테스트 진행	게임동아
넷마블 '뱀피르', 신규 클래스 ‘아카샤’ 소개 특집 페이지 오픈	게임동아
넷마블 '세븐나이츠 리버스', 센서타워 APAC 어워즈 ‘최고의 턴제 RPG’ 선정	게임동아
넥써쓰, GDC 2026 참가해 ‘게임·AI·블록체인’ 전략 공개	게임동아
농심 레드포스 아레나 호치민 1호점 오픈... 베트남으로 나간 K-PC방	게임동아
스팀으로 재출시된 파판7. 공짜로 줘도 욕 먹네	게임동아
웹젠 R2 ORIGIN, 신규 육성 콘텐츠 ‘잠재력’ 업데이트	게임동아
뉴욕주, 밸브에 소송 제기... “루트박스 방식이 전형적인 도박 구조”	게임동아
바이오하자드 레퀴엠, 메타크리틱 88점... ‘바하4 이후 20년 만에 최고 평가’	게임동아
블로믹스, 블루포션게임즈와 '에오스 레드·에오스 블랙 공동 서비스 계약	게임동아
펄어비스 ‘붉은사막’, 주요 성우진 인터뷰 영상 공개	게임동아
블리자드, '오버워치' IP 기반의 쿼터뷰 협동 슈팅 '오버워치 러시' 발표	게임동아
AI는 적이다! AI 빌런의 위협에 맞서는 게임들	게임동아
[동아게임백과사전] 침팬지가 나보다 마인크래프트 잘하는데? 게임하는 ‘동물’들	게임동아
스마일게이트 ‘카제나’, 은하계 재해 시즌2 신규 스토리 업데이트	게임동아
“꽃은 다시 지고 핀다!” 한번 망했다가 다시 부활한 게임	게임동아
NHN, 수집형 RPG ‘어비스디아’ 정식 출시...'복스럽게 먹는 미소녀들' 호평	게임동아
[순위분석] 글로벌 동기화 눈앞, 파판 14 관심 최고조	게임메카
에릭슨, AI 시대 네트워크 전략 공개…“5G SA는 이미 답…수익화가 숙제”	IT동아
슈퍼캣 ‘돌 키우기 온라인’, 서버 이용자들 협동하는 ‘도시 복구 이벤트’ 26일 업데이트 예고!	게임동아
스마일게이트 ‘로드나인’, 장비 각성 및 신규 사냥터 추가 등 시즌2 첫 업데이트 진행	게임동아
SOOP, 누적 시청자 2300만명 '2026 LoL 멸망전 시즌 1' 개최	게임동아
넷마블 '레이븐2', '사역마 원정대' 등 업데이트 실시	게임동아
SM엔터 아이돌과 함께 퍼즐삼매경! 카카오게임즈, SMiniz(슴미니즈) 정식 출시	게임동아
메르세데스-벤츠 코리아, '한국여자오픈' 타이틀 스폰서 참여	글로벌오토뉴스
AI뉴스 2배 넘게 좋아진 Gemini 3.1 Pro, Lyria 3, Sonnet 4.6, Claude Code 업데이트, 보안주 급락, Grok 4.2, Qwen3.5 등 동영상 있음	조코딩 JoCoding
폭스바겐 '시세 이하 미끼, 유령차 주의' 가짜 중고차 사이트 사기 경고	오토헤럴드
기아 美 조지아 공장 2009년 가동, 16년만 누적 생산 500만대 돌파	오토헤럴드
'엄마의 마음으로 뽑은 최고의 패밀리카' 현대차, 4개 모델 수상	오토헤럴드
픽업트럭 제왕 '램' 차봇모터스와 손잡고 한국 상륙… 4월 ‘램 1500’ 출시	오토헤럴드
아우디 레볼루트 F1팀, 아디다스와 협업한 팀웨어 및 팬웨어 컬렉션 공개	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

네이버·KAIST가 발견한 AI 학습 비밀? 50% 난도로 훈련하면 성능 10배 향상

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

네이버·KAIST가 발견한 AI 학습 비밀? 50% 난도로 훈련하면 성능 10배 향상

공유하기

공감/비공감