비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

네이버·KAIST가 발견한 AI 학습 비밀? 50% 난도로 훈련하면 성능 10배 향상

2025.07.02. 18:57:36
조회 수
52
7

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Online Difficulty Filtering for Reasoning Oriented Reinforcement Learning


AI가 수학 문제를 잘 풀 수 있게 훈련시키려면 어떤 문제를 주는 것이 좋을까? 네이버 클라우드(NAVER Cloud)와 KAIST AI 연구진이 답을 찾았다. AI가 절반 정도 맞힐 수 있는 중간 난이도 문제로 훈련시키면 학습 효과가 가장 좋다는 것이다. 이를 '균형 온라인 난이도 필터링(Balanced Online Difficulty Filtering)'이라고 부르며, AI 모델이 현재 수준에서 50% 정도 맞출 수 있는 문제들만 골라서 훈련에 사용한다.

AI 학습에서는 사람처럼 단계별로 어려운 문제를 차근차근 배우는 것이 중요하다. 너무 쉬운 문제는 새로 배울 것이 없고, 너무 어려운 문제는 도저히 풀 수 없어서 포기하게 된다. 마치 중학생에게 대학 수학 문제를 주거나 초등학교 산수 문제를 주는 것과 같다. 연구진은 수학적 분석을 통해 AI가 50% 정도 맞힐 수 있는 문제가 학습에 가장 도움이 된다는 것을 증명했다.


가장 어려운 수학 시험에서 10% 더 높은 점수 달성

해당 연구 논문에 따르면, 이 새로운 방법으로 AI를 훈련시킨 결과, 기존 방법보다 평균 4% 더 좋은 성과를 거뒀다. 특히 미국의 가장 어려운 수학 경시대회인 AIME(American Invitational Mathematics Examination)에서는 무려 10% 포인트나 더 높은 점수를 받았다. 이는 마치 평소 60점 받던 학생이 갑자기 70점을 받게 된 것과 같은 큰 향상이다.

연구진은 Qwen2.5-3B라는 AI 모델을 사용해서 5가지 서로 다른 수학 시험으로 실험했다. 기존 방법들은 미리 정해진 순서대로 쉬운 문제부터 어려운 문제까지 차례로 풀게 했지만, 새로운 방법은 실시간으로 AI의 실력을 파악해서 딱 맞는 난이도의 문제만 골라준다. AI가 문제를 16번 풀어본 결과를 보고 통과율을 계산한 다음, 25%에서 75% 사이로 맞힐 수 있는 문제들만 다음 훈련에 사용한다.


훈련 시간을 절반으로 줄이면서도 더 좋은 결과

이 방법의 가장 큰 장점은 훈련 시간과 비용을 크게 줄일 수 있다는 것이다. 기존 방법으로 100일 걸리던 훈련을 60일 만에 끝낼 수 있으면서도 더 좋은 성과를 낼 수 있다. AI 훈련에는 엄청난 전기료와 컴퓨터 비용이 들기 때문에 이런 효율성 향상은 매우 중요하다.

연구 결과, 너무 쉽거나 너무 어려운 문제들을 모두 제거하는 균형 잡힌 방법이 한쪽만 제거하는 방법보다 훨씬 효과적이었다. 마치 운동할 때 너무 가벼운 무게로도 너무 무거운 무게로도 근육이 늘지 않는 것처럼, AI도 적당한 난이도의 문제로 훈련해야 실력이 늘어난다. 연구진의 분석에 따르면 100% 맞히거나 0% 맞히는 문제들은 AI가 새로 배울 것이 전혀 없어서 시간 낭비일 뿐이다.


AI 실력이 늘면 자동으로 더 어려운 문제 제공

이 방법의 또 다른 신기한 점은 AI가 실력이 늘어갈수록 자동으로 더 어려운 문제를 제공한다는 것이다. 처음에는 AI가 절반 정도 맞힐 수 있는 비교적 쉬운 문제들로 시작하지만, 훈련이 진행되면서 AI의 실력이 늘어나자 더 어려운 문제들이 자연스럽게 훈련 세트에 포함됐다. 이는 마치 게임에서 레벨이 올라갈수록 더 강한 몬스터가 나타나는 것과 비슷하다.

실험에서 사용한 방법은 여러 개의 문제를 동시에 처리할 수 있도록 설계돼서 훈련 과정이 안정적이고 빨랐다. 각 문제를 몇 번씩 풀어봤는지 기록해서 같은 문제를 반복하지 않도록 하고, 정해진 개수의 문제가 모이면 바로 훈련을 시작할 수 있도록 만들어졌다.


FAQ

Q: 왜 50% 정도 맞히는 문제가 학습에 가장 좋은가요?

A: 사람이 공부할 때도 너무 쉬우면 배울 게 없고 너무 어려우면 포기하게 되는 것처럼, AI도 마찬가지입니다. 50% 정도 맞힐 수 있는 문제는 AI가 노력하면 풀 수 있으면서도 새로운 것을 배울 수 있는 딱 좋은 난이도입니다.

Q: 이 방법이 기존 방법보다 왜 더 효과적인가요?

A: 기존 방법은 미리 정해진 순서대로 문제를 주지만, 새로운 방법은 AI의 현재 실력을 실시간으로 파악해서 딱 맞는 난이도의 문제만 골라줍니다. 덕분에 가장 어려운 수학 시험에서 10% 더 높은 점수를 받을 수 있었습니다.

Q: 실제로 어떤 분야에서 이 기술을 사용할 수 있나요?

A: 수학 문제를 푸는 AI, 논리적 추론이 필요한 AI, 복잡한 문제 해결 AI 등을 만들 때 사용할 수 있습니다. 훈련 시간과 비용을 절반으로 줄이면서도 더 좋은 성능의 AI를 만들 수 있어서 매우 실용적입니다.

해당 기사에 인용한 논문 원문은 arvix에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
4/1
GM·LG엔솔 “LFP보다 효율 뛰어난 LMR 배터리로 승부수 띄울 것” IT동아
산불·쓰나미·지진 등 재난 인명 피해, 첨단 음향 기술로 줄인다 IT동아
뇌수술 받고 재기한 우들런드, 골프 라이더컵 부단장 선임 연합뉴스
대원씨티에스, ASRock 메인보드 사용자 위한 '안심 케어' 서비스 시행 다나와
“AI가 가짜뉴스 잡는다”… X, 커뮤니티 노트에 AI 챗봇 투입 (1) AI matters
아마존, 창고 로봇 누적 100만 대 배치… AI 모델로 창고 자율주행 10% 향상 AI matters
네이버·KAIST가 발견한 AI 학습 비밀? 50% 난도로 훈련하면 성능 10배 향상 AI matters
"아니야, 그 명령은 위험해" AI가 인간의 명령을 거부해야만 하는 이유 AI matters
메타 AI, 인간처럼 보고 듣는 AI 로봇 공개... 구체화 AI 에이전트 시대 개막 AI matters
[Q&AI] 걸스데이 혜리 열애설… 상대는 누구? AI matters
대학생 47% "생성형 AI로 과제 작성"… AI 탐지 검출률은 88%뿐 AI matters
"AI 의사가 인간 의사보다 4배 정확"... MS 의료 AI, 80% 진단 성공률 달성 AI matters
챗GPT 사용량 2배 증가한 호주... 오픈AI, 연 102조 원 경제효과 발생 청사진 AI matters
AI 시대 뜨거운 감자 '보안 문제', 84%가 찾는 해결책은 엣지-클라우드 통합 AI matters
북한 해커들, 핵무기 자금 조달 위해 美 IT기업 직원으로 위장… 69억원 훔치려다 적발 AI matters
챗GPT 출시 후, 신입 일자리 1/3 감소… 소매업 78%, 다른 일자리도 절반 수준 (1) AI matters
2025년 기술업계 해고 계속된다... 상반기에만 2만 2천 명 감원 AI matters
메타, 2025년 7월 '초지능' 연구소 신설... 알렉산더 왕이 이끈다 AI matters
美 의회, 주 정부의 ‘AI 규제 권한’ 5년간 제한하는 법안 재추진… 찬반 격돌 AI matters
애플, 이번엔 시리에 챗GPT-클로드 탑재 검토… 자체 기술 한계 직면 AI matters
이 시간 HOT 댓글!
1/4