로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    "AI 학습에 수십억 쓰기 전, 결과 예측한다"... 메타, 강화 학습 결과 예측하는 공식 공개

    2025.10.24. 09:31:33
    읽음217

    메타(Meta), 텍사스대학교 오스틴, UC버클리, 하버드대학교 등 공동 연구진이 인공지능 학습의 성능을 미리 예측할 수 있는 방법을 찾아냈다. 연구진은 40만 GPU 시간 이상을 투입한 대규모 실험을 통해, 컴퓨터 자원을 얼마나 투입하면 어느 정도 성능이 나올지 예측하는 수학 공식을 개발했다. 이를 바탕으로 10만 GPU 시간 규모까지 안정적으로 작동하는 새로운 학습 방법 'ScaleRL'도 함께 선보였다.

    AI가 스스로 학습하는 과정, 이제 예측 가능해졌다

    연구 논문에 따르면, 연구진은 AI의 '강화학습' 성능을 예측하기 위해 S자 곡선 모양의 그래프를 제안했다. 강화학습이란 AI가 시행착오를 거치며 스스로 학습하는 방식이다. 이 그래프는 세 가지 중요한 값으로 구성된다. 첫째, A는 아무리 많은 컴퓨터 자원을 투입해도 도달할 수 있는 최고 성능을 뜻한다. 둘째, B는 컴퓨터 자원 대비 얼마나 효율적으로 학습하는지를 나타낸다. 셋째, Cmid는 목표 성능의 절반에 도달하는 데 필요한 컴퓨터 자원의 양이다.

    이 방법의 가장 큰 장점은 미래를 내다볼 수 있다는 점이다. 연구진은 80억 개 파라미터 모델과 17B×16 MoE 모델을 대상으로 실험했다. 80억 파라미터 모델의 경우, 학습 초반 5만 GPU 시간까지의 데이터만으로 10만 GPU 시간까지의 최종 성능을 예측했는데, 실제 결과가 예측과 거의 일치했다. 이는 연구자들이 비용과 시간이 많이 드는 전체 실험을 끝까지 하지 않아도, 어떤 방법이 효과적일지 미리 알 수 있다는 의미다.


    같은 노력, 다른 결과: 학습 방법마다 성능 한계가 다르다

    연구에서 밝혀진 중요한 사실은 AI 학습 방법마다 도달할 수 있는 최고 성능이 다르다는 점이다. 연구진이 개발한 ScaleRL은 최종 점수 0.61을 기록했다. 반면 중국 딥시크(DeepSeek)의 방식은 0.490, 중국 큐웬(Qwen)의 방식은 0.515에 그쳤다. 이는 단순히 속도 차이가 아니라, 근본적으로 도달 가능한 성능의 천장이 다르다는 뜻이다.

    어떤 요소가 이런 차이를 만들까? 연구진은 몇 가지 기술적 선택이 최고 성능을 바꿀 수 있다는 것을 발견했다. 특히 AI 모델이 계산할 때 더 정밀한 방식을 사용하자 최종 성능이 0.52에서 0.61로 크게 향상됐다. 이는 학습 과정에서 발생하는 미세한 오차를 줄였기 때문이다.

    처음엔 좋아 보여도 끝은 다를 수 있다... 초기 성능의 함정

    "작은 실험에서 좋았던 방법이 큰 실험에서도 최선은 아니다"라는 원칙이 AI 학습에서도 적용된다는 사실이 확인됐다. 적은 컴퓨터 자원으로 실험할 때 더 나아 보이는 방법이, 자원을 크게 늘렸을 때 오히려 더 나쁜 결과를 낼 수 있다. 따라서 초기 성능만 보고 어떤 방법이 좋을지 판단해선 안 된다.

    연구진의 예측 공식은 이 문제를 해결한다. 학습 초반 데이터에서 성능 한계값 A와 효율성 지표 B를 계산하면, 전체 실험을 끝내지 않아도 어떤 방법이 최종적으로 더 나을지 알 수 있다. 예를 들어, 어떤 방법은 초반에 빠르게 좋아지지만 낮은 한계에 멈추고, 다른 방법은 천천히 개선되지만 결국 더 높은 성능에 도달한다.

    ScaleRL: 대규모로 키워도 안정적인 새로운 학습법

    연구진은 가장 효과적인 설정들을 모아 ScaleRL이라는 학습 방법을 만들었다. ScaleRL의 가장 큰 장점은 조건이 바뀌어도 예측대로 작동한다는 점이다. 한 번에 학습하는 데이터 양을 2.5배 늘리거나, AI가 생성하는 답변 길이를 32배 확장하거나, 수학과 코딩 문제를 동시에 풀게 하거나, 더 큰 모델을 사용해도 모두 예측대로 결과가 나왔다.

    80억 파라미터 모델의 10만 GPU 시간 실험에서, 절반만 학습한 시점의 데이터로 최종 성능을 예측했는데 실제 결과와 거의 일치했다. 이는 ScaleRL이 대규모 학습에서도 믿고 쓸 수 있는 방법임을 증명한다.


    FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

    Q1. 강화학습 예측 공식이란 무엇이고 왜 필요한가요?

    A: 강화학습 예측 공식은 컴퓨터 자원을 얼마나 쓰면 AI 성능이 어느 정도 나올지 미리 계산하는 수학 공식입니다. 이를 쓰면 연구자들이 비싼 실험을 끝까지 하지 않아도 초반 데이터만으로 최종 결과를 예측할 수 있어, 시간과 비용을 크게 절약할 수 있습니다.

    Q2. ScaleRL이 기존 방법보다 좋은 이유는 무엇인가요?

    A: ScaleRL은 도달 가능한 최고 성능(0.61점)과 학습 효율성(1.97) 모두에서 우수합니다. 딥시크나 큐웬 같은 기존 방법보다 최종 성능이 높고, 10만 GPU 시간 규모까지 안정적으로 작동하는 것이 검증됐습니다.

    Q3. 이 연구가 실제 AI 개발에 어떤 도움이 되나요?

    A: 이 연구는 AI의 추론 능력을 높이는 강화학습을 더 예측 가능하고 저렴하게 만듭니다. 연구자들은 이제 작은 실험으로 큰 실험의 성공 가능성을 미리 평가할 수 있어, 대학과 기업 모두에서 AI 발전 속도가 빨라질 것으로 예상됩니다.

    해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

    논문명: The Art of Scaling Reinforcement Learning Compute for LLMs

    이미지 출처: 이디오그램 생성

    해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.





    AI Matters 뉴스레터 구독하기
    태그
    AI
    안내 ?

    말 많은 뉴스

    • 1

      미니 PC, 노트북 싹 다 가짜였습니다. 쿠팡에 침투한 중국 사기단의 정체

      댓글10
      미니 PC, 노트북 싹 다 가짜였습니다. 쿠팡에 침투한 중국 사기단의 정체
    • 2

      그래픽카드에 ₩15,000,000 태우고 알아낸 사실. 2025~2026 그래픽카드 18종 벤치마크

      댓글7
      그래픽카드에 ₩15,000,000 태우고 알아낸 사실.  2025~2026 그래픽카드 18종 벤치마크
    • 3

      메르세데스-AMG, 4기통 버리고 6기통·V8 귀환… 브랜드 전략 전면 수정

      댓글7
      메르세데스-AMG, 4기통 버리고 6기통·V8 귀환… 브랜드 전략 전면 수정
    • 4

      뜨거운 물 틀었다가 찬물 섞는 사람들은 보세요

      댓글6
      뜨거운 물 틀었다가 찬물 섞는 사람들은 보세요
    • 5

      SFF PC 유행 예감! 근데... 문제는 파워 가격? feat. 메모리

      댓글5
      SFF PC 유행 예감! 근데... 문제는 파워 가격? feat. 메모리

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 앤트로픽, 파워포인트용 클로드 베타 출시…템플릿 인식해 슬라이드 자동 생성

      AI matters 19:25:29
      읽음 41
    • 요기요, 챗GPT에 국내 배달앱 최초로 앱 개설… "대화로 맛집 찾고 주문까지"

      AI matters 19:25:15
      읽음 41
    • 한국 교육부, 2028년부터 AI로 수능 영어 지문 만든다

      AI matters 19:25:06
      읽음 43
    • 서린씨앤아이, 팀그룹 고성능 메모리 구매 시 한정판 키링 증정 프로모션 실시

      다나와 19:23:12
      읽음 60
    • STCOM, PNY 지포스 RTX 50 구매자 대상 바이오하자드 게임 번들 증정 행사

      다나와 19:22:52
      읽음 50
    • 인텔 공인대리점 3사 '인텔 정품 CPU 빌드 자랑' 프로모션

      다나와 19:22:27
      읽음 50
    • 조텍, RTX 5070 이상 그래픽카드 대상 ‘바이오하자드 : 레퀴엠’ 번들 프로모션

      다나와 19:22:10
      읽음 57
    • 서린씨앤아이 '에센코어 클레브' 굿즈 증정 SNS 이벤트 진행

      다나와 19:21:39
      읽음 50
    • 에스티컴퓨터 'XFX 라데온 RX 9070' 시리즈 구매자 대상 붉은 사막 번들 증정 행사

      다나와 19:18:42
      읽음 54
    • 다나와, 불황에도 소고기 거래액 3배 증가…’설 선물 양극화’

      다나와 19:18:05
      읽음 47 공감 1 댓글 1
    • 아이노비아 ‘INNO3D 지포스 RTX 5070 이상’ 그래픽카드 구매 시 ‘바이오하자드 레퀴엠’ 증정

      다나와 19:17:31
      읽음 50
    • 10주년 맞은 노 맨즈 스카이, 6.2 업데이트 ‘렘넌트’ 배포

      게임메카 19:15:47
      읽음 41
    • [오늘의 스팀] 디아블로 2 스팀에 등장, 판매 최상위

      게임메카 18:55:45
      읽음 43
    • 별도의 최적화 패치도 필요 없다! 300MB 미만으로 즐기는 초경량 게임들

      게임동아 16:34:25
      읽음 69 공감 1
    • 초이락, 설 맞아 피닉스맨 '엑스타리온', 헬로카봇 '빅포트' 완구 출시

      게임동아 15:42:06
      읽음 53
    • 한국e스포츠협회, 2026 아이치-나고야 아시안게임 국가대표 지도자 4인 공개

      게임동아 15:06:49
      읽음 58
    • 아쿠아맨 제이슨 모모아, 영화 '헬다이버즈' 주연으로

      게임메카 14:10:12
      읽음 66 공감 1
    • '롬', 부스팅 서버 '실리드' 시즌2 오픈 실시

      게임동아 13:55:09
      읽음 51
    • ‘대항해시대 오리진’, 신규 업데이트&설 명절 이벤트 실시

      게임동아 13:54:50
      읽음 56
    • 넥슨의 야심작 ‘낙원’ 3월 글로벌 알파 테스트 참가자 모집

      게임동아 13:54:33
      읽음 53
    • 넥슨, '2026년 NDC' 발표자 모집 개시

      게임동아 13:54:16
      읽음 56
    • '승리의 여신: 니케' × TV 애니메이션 '리코리스 리코일' 콜라보 업데이트

      게임동아 13:54:00
      읽음 63
    • "귀성길에서도 게임하자!" Xbox 설 맞이 새해 소망별 추천 게임 공개

      게임동아 13:53:36
      읽음 55 공감 1
    • '400만 대 찍었다' 르노 부산 공장 글로벌 전략 허브로 자리매김

      오토헤럴드 13:47:46
      읽음 58
    • GM, 핵심 부품 협력사 ‘퍼스트 브랜드’ 파산으로 공급망 리스크 비상

      오토헤럴드 13:47:43
      읽음 55
    • '누적 6948대' 현대차 김기양 영업 이사 2025년 승용 부문 판매 1위

      오토헤럴드 13:47:38
      읽음 55
    • 이름만 남긴 '토요타 하이랜더' 간판급 중형 순수 전기 SUV로 변신

      오토헤럴드 13:47:36
      읽음 146
    • '모터사이클 타고 영종도로' BMW, 모토라드 트랙 체험 참가자 모집

      오토헤럴드 13:47:33
      읽음 54
    • 화물차 장거리·심야 운행 교통사고 예방하는 첨단 안전 사양에 주목

      오토헤럴드 13:47:31
      읽음 57
    • [EV 트렌드] 16개월 26만km 달린 '샤오미 SU7' 배터리 놀라운 잔존율

      오토헤럴드 13:47:28
      읽음 118
    • 현대차, 인증중고차 이용 고객에 '더드림' 쿠폰 제공 프로모션 실시

      오토헤럴드 13:47:25
      읽음 52
    • '자꾸 이러면 문 닫는다' 테슬라, 獨 최대 노조 IG 메탈과 갈등 고조

      오토헤럴드 13:47:22
      읽음 55
    • 현대차 아이오닉 5, 웨이모 5만대 공급설 '로보택시 대량 생산 기대'

      오토헤럴드 13:47:19
      읽음 54
    • “4 Million Units Produced” — Renault Busan Plant Establishes Itself as a Global Strategic Hub

      오토헤럴드 13:47:16
      읽음 51
    • '고전압 부품 체결 불량' 현대차 美 판매분 아이오닉 5·9 리콜

      오토헤럴드 13:47:14
      읽음 49
    • 기아 역사 담긴 시흥서비스센터, 원스톱 복합 거점 플래그십 스토어 재탄생

      오토헤럴드 13:47:09
      읽음 50
    • [영상] 가성비 전기차의 진수, BYD 돌핀 시승기

      글로벌오토뉴스 13:47:00
      읽음 62
    • 제네시스, 2027년 독자 플랫폼 시대 연다

      글로벌오토뉴스 13:46:57
      읽음 58
    • 홍치 HS6 PHEV, 영하 20도 뚫고 1,131km 주행… 기네스 신기록 달성

      글로벌오토뉴스 13:46:55
      읽음 60
    • 테슬라 주도 전기차 가격 인하에도 1월 미국 판매 30% 급락

      글로벌오토뉴스 13:46:47
      읽음 55
    • 리비안 R2, 656마력의 압도적 성능… 테슬라 모델 Y 와 경쟁 예고

      글로벌오토뉴스 13:46:45
      읽음 58
    • 현대차, 미국서 5년 연속 신기록… 2026년 미국산 하이브리드로 제2의 도약

      글로벌오토뉴스 13:46:42
      읽음 61
    • BYD, 800V 무장한 아토 3 에보 공개… 테슬라·현대차에 성능으로 도전장

      글로벌오토뉴스 13:46:39
      읽음 58
    • 토요타, 2026년 미국산 전기차 하이랜더 EV 출시… 현지 생산 체제 대전환

      글로벌오토뉴스 13:46:36
      읽음 59
    • BYD, 맨체스터 시티와 글로벌 파트너십 체결

      글로벌오토뉴스 13:46:33
      읽음 56
    • HS효성더클래스, 설맞이 특별 프로모션 진행

      글로벌오토뉴스 13:46:31
      읽음 55
    • 고속도로 화물차 사고 사망 비중 급증… 첨단 안전 시스템 중요성 부각

      글로벌오토뉴스 13:46:29
      읽음 58
    • BMW 모토라드, 영종도 서킷 열린다… 3월 1일 ‘모토라드 온 트랙’ 개최

      글로벌오토뉴스 13:46:26
      읽음 47
    • 한성모터스, 설 맞이 ‘럭키 드라이브 2026’ 캠페인 개최

      글로벌오토뉴스 13:46:24
      읽음 56
    • 콘티넨탈타이어, 신제품 ‘익스트림콘택트 XC7’ 소비자 체험단 모집

      글로벌오토뉴스 13:46:21
      읽음 56
    • 답 안 나올 땐 답나와를 찾아주세요.

    • [2.10~2.23] 주연테크 Q27C15 IPS QHD USB-C 100

    • 경품이 99개! 2월 무~제한 포인트 룰렛

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 잘만
    • 다크플래쉬
    • MICRONICS
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 6
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5909202 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.