로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 다나와 2TV
      노리다
    • 샵다나와 조립갤러리
    >
    이전 글
    다음 글
    AI matters

    "AI 학습에 수십억 쓰기 전, 결과 예측한다"... 메타, 강화 학습 결과 예측하는 공식 공개

    2025.10.24. 09:31:33
    읽음56

    메타(Meta), 텍사스대학교 오스틴, UC버클리, 하버드대학교 등 공동 연구진이 인공지능 학습의 성능을 미리 예측할 수 있는 방법을 찾아냈다. 연구진은 40만 GPU 시간 이상을 투입한 대규모 실험을 통해, 컴퓨터 자원을 얼마나 투입하면 어느 정도 성능이 나올지 예측하는 수학 공식을 개발했다. 이를 바탕으로 10만 GPU 시간 규모까지 안정적으로 작동하는 새로운 학습 방법 'ScaleRL'도 함께 선보였다.

    AI가 스스로 학습하는 과정, 이제 예측 가능해졌다

    연구 논문에 따르면, 연구진은 AI의 '강화학습' 성능을 예측하기 위해 S자 곡선 모양의 그래프를 제안했다. 강화학습이란 AI가 시행착오를 거치며 스스로 학습하는 방식이다. 이 그래프는 세 가지 중요한 값으로 구성된다. 첫째, A는 아무리 많은 컴퓨터 자원을 투입해도 도달할 수 있는 최고 성능을 뜻한다. 둘째, B는 컴퓨터 자원 대비 얼마나 효율적으로 학습하는지를 나타낸다. 셋째, Cmid는 목표 성능의 절반에 도달하는 데 필요한 컴퓨터 자원의 양이다.

    이 방법의 가장 큰 장점은 미래를 내다볼 수 있다는 점이다. 연구진은 80억 개 파라미터 모델과 17B×16 MoE 모델을 대상으로 실험했다. 80억 파라미터 모델의 경우, 학습 초반 5만 GPU 시간까지의 데이터만으로 10만 GPU 시간까지의 최종 성능을 예측했는데, 실제 결과가 예측과 거의 일치했다. 이는 연구자들이 비용과 시간이 많이 드는 전체 실험을 끝까지 하지 않아도, 어떤 방법이 효과적일지 미리 알 수 있다는 의미다.


    같은 노력, 다른 결과: 학습 방법마다 성능 한계가 다르다

    연구에서 밝혀진 중요한 사실은 AI 학습 방법마다 도달할 수 있는 최고 성능이 다르다는 점이다. 연구진이 개발한 ScaleRL은 최종 점수 0.61을 기록했다. 반면 중국 딥시크(DeepSeek)의 방식은 0.490, 중국 큐웬(Qwen)의 방식은 0.515에 그쳤다. 이는 단순히 속도 차이가 아니라, 근본적으로 도달 가능한 성능의 천장이 다르다는 뜻이다.

    어떤 요소가 이런 차이를 만들까? 연구진은 몇 가지 기술적 선택이 최고 성능을 바꿀 수 있다는 것을 발견했다. 특히 AI 모델이 계산할 때 더 정밀한 방식을 사용하자 최종 성능이 0.52에서 0.61로 크게 향상됐다. 이는 학습 과정에서 발생하는 미세한 오차를 줄였기 때문이다.

    처음엔 좋아 보여도 끝은 다를 수 있다... 초기 성능의 함정

    "작은 실험에서 좋았던 방법이 큰 실험에서도 최선은 아니다"라는 원칙이 AI 학습에서도 적용된다는 사실이 확인됐다. 적은 컴퓨터 자원으로 실험할 때 더 나아 보이는 방법이, 자원을 크게 늘렸을 때 오히려 더 나쁜 결과를 낼 수 있다. 따라서 초기 성능만 보고 어떤 방법이 좋을지 판단해선 안 된다.

    연구진의 예측 공식은 이 문제를 해결한다. 학습 초반 데이터에서 성능 한계값 A와 효율성 지표 B를 계산하면, 전체 실험을 끝내지 않아도 어떤 방법이 최종적으로 더 나을지 알 수 있다. 예를 들어, 어떤 방법은 초반에 빠르게 좋아지지만 낮은 한계에 멈추고, 다른 방법은 천천히 개선되지만 결국 더 높은 성능에 도달한다.

    ScaleRL: 대규모로 키워도 안정적인 새로운 학습법

    연구진은 가장 효과적인 설정들을 모아 ScaleRL이라는 학습 방법을 만들었다. ScaleRL의 가장 큰 장점은 조건이 바뀌어도 예측대로 작동한다는 점이다. 한 번에 학습하는 데이터 양을 2.5배 늘리거나, AI가 생성하는 답변 길이를 32배 확장하거나, 수학과 코딩 문제를 동시에 풀게 하거나, 더 큰 모델을 사용해도 모두 예측대로 결과가 나왔다.

    80억 파라미터 모델의 10만 GPU 시간 실험에서, 절반만 학습한 시점의 데이터로 최종 성능을 예측했는데 실제 결과와 거의 일치했다. 이는 ScaleRL이 대규모 학습에서도 믿고 쓸 수 있는 방법임을 증명한다.


    FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

    Q1. 강화학습 예측 공식이란 무엇이고 왜 필요한가요?

    A: 강화학습 예측 공식은 컴퓨터 자원을 얼마나 쓰면 AI 성능이 어느 정도 나올지 미리 계산하는 수학 공식입니다. 이를 쓰면 연구자들이 비싼 실험을 끝까지 하지 않아도 초반 데이터만으로 최종 결과를 예측할 수 있어, 시간과 비용을 크게 절약할 수 있습니다.

    Q2. ScaleRL이 기존 방법보다 좋은 이유는 무엇인가요?

    A: ScaleRL은 도달 가능한 최고 성능(0.61점)과 학습 효율성(1.97) 모두에서 우수합니다. 딥시크나 큐웬 같은 기존 방법보다 최종 성능이 높고, 10만 GPU 시간 규모까지 안정적으로 작동하는 것이 검증됐습니다.

    Q3. 이 연구가 실제 AI 개발에 어떤 도움이 되나요?

    A: 이 연구는 AI의 추론 능력을 높이는 강화학습을 더 예측 가능하고 저렴하게 만듭니다. 연구자들은 이제 작은 실험으로 큰 실험의 성공 가능성을 미리 평가할 수 있어, 대학과 기업 모두에서 AI 발전 속도가 빨라질 것으로 예상됩니다.

    해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

    논문명: The Art of Scaling Reinforcement Learning Compute for LLMs

    이미지 출처: 이디오그램 생성

    해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.





    AI Matters 뉴스레터 구독하기
    태그
    AI
    안내 ?

    말 많은 뉴스

    • 1

      샘 알트먼, 2025년생 아이는 AI보다 똑똑해지기 어려울 것

      댓글8
      샘 알트먼, 2025년생 아이는 AI보다 똑똑해지기 어려울 것
    • 2

      제네시스, 2026년형 GV70 출시…정숙성 강화·패키지 재편 완성도 높여

      댓글7
      제네시스, 2026년형 GV70 출시…정숙성 강화·패키지 재편 완성도 높여
    • 3

      거의 40년 넘는 골뱅이 전쟁, 원조의 품격이냐! 마케팅의 승리냐! [라이벌열전]

      댓글6
      거의 40년 넘는 골뱅이 전쟁, 원조의 품격이냐! 마케팅의 승리냐! [라이벌열전]
    • 4

      손흥민에게 PC 선물한 라이엇

      댓글5
      손흥민에게 PC 선물한 라이엇
    • 5

      바쁜 일상 속에도 한숨 돌리게 해주는 아이템? 그것은 바로 하이얼 식기세척기

      댓글5
      바쁜 일상 속에도 한숨 돌리게 해주는 아이템? 그것은 바로 하이얼 식기세척기

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 엔딩 개선 포함, '하데스 2' 첫 업데이트 공개

      게임메카 19:24:32
      읽음 31
    • 벤디와 잉크기계 등, 에픽 공포게임 명작 무료 배포

      게임메카 19:16:54
      읽음 32
    • "재치 넘치는 우주RPG" 아우터 월드 2 메타크리틱 84점

      게임메카 19:16:25
      읽음 31
    • 사람대신 일하는 AI 브라우저 ‘챗GPT 아틀라스’ 공개’ / 25년 10월 4주차 [주간 AI 뉴스]

      AI matters 18:36:38
      읽음 145
    • [10월 24일 AI 뉴스 브리핑] 퀀텀에어로·콕스웨이브, 국방 AI 기술개발 MOU 체결 외

      AI matters 18:25:21
      읽음 35
    • 당신의 뇌가 위험하다... AI 의존이 부르는 '사고의 획일화'

      AI matters 18:25:10
      읽음 40 공감 2 댓글 2
    • 생성형AI에 투자한 기업 95%가 수익 제로… 이유 살펴봤더니

      AI matters 18:24:53
      읽음 35
    • 오픈AI, 한국 경제 청사진 발표... 반도체·인프라 강점 살려 AI 리더십 확보해야

      AI matters 18:20:52
      읽음 41
    • 유튜브 넘어선 챗GPT... "2년 만에 1개월 유지율 60→90% 급등"

      AI matters 18:04:35
      읽음 45
    • 아마존, 배달기사 전용 ‘AI 안경’ 테스트 중… 길 안내부터 배송 정보까지 띄워준다

      AI matters 18:04:24
      읽음 48 공감 1 댓글 1
    • "내 반려견을 영상 주인공으로"... 오픈AI, 소라에 신규 기능 대거 추가 예고

      AI matters 17:53:20
      읽음 39
    • K-water–OpenAI, AI로 물관리·기후재난 예측 혁신 손잡다

      다나와 17:02:43
      읽음 136 공감 2
    • 日 후지쿠라, AI 데이터센터 붐 타고 니케이 ‘스타 주역’으로 부상

      다나와 17:02:31
      읽음 54
    • 거대 투자자, ‘닷컴 플레이북’ 꺼내 AI 과열 피한다

      다나와 17:02:18
      읽음 61 공감 1
    • 애스턴마틴, 플로리다 데이토나비치 해안에 초호화 주거단지 개발

      글로벌오토뉴스 16:47:14
      읽음 51
    • 현대차, 글로벌 정비사 기술 경연 제15회 월드스킬올림픽 개최

      글로벌오토뉴스 16:47:11
      읽음 42
    • 이엠텍, 지포스 RTX 50 시리즈 구매 시 이엠텍 시그니처 후드티 증정 이벤트 진행

      다나와 16:06:55
      읽음 67 공감 2
    • [체험기] 이게 레이싱이야 액션 게임이야? '커비의 에어 라이더'

      게임동아 16:00:05
      읽음 44 공감 1
    • 위드앤아이티, 2025 테라마스터 신제품 세미나 성황리에 개최

      다나와 15:56:02
      읽음 64
    • “당신이 왜 이 제품을 사야 하냐면요” 아마존, 새 AI 쇼핑 기능 ‘Help me decide’ 공개

      다나와 14:26:39
      읽음 78 공감 1 댓글 1
    • 비자, AI 쇼핑 급성장 속 새 보안 프로토콜 공개

      다나와 14:26:14
      읽음 53
    • 세계 언론 연합 AI 뉴스 정확도 조사…'응답 중 45%는 중대한 오류'

      다나와 14:25:57
      읽음 60
    • ‘디지털에서도 럭셔리하게’ 애스턴마틴, 현실감 높인 온라인 차량 구성기 공개

      뉴스탭 13:50:19
      읽음 57 공감 1
    • ‘별이 빛나는 밤’이 살아났다…서울드래곤시티, 고흐 명화 실감 전시

      뉴스탭 13:50:16
      읽음 60 공감 2 댓글 1
    • “게이머의 천국 열린다”… ASUS ROG, ‘키덕투어 in 수원’서 신제품 대거 공개

      뉴스탭 13:50:13
      읽음 76 공감 3 댓글 1
    • “통신비 월 2천 원 수준” U+유모바일, 다이소 상품권 포함한 ‘5천 원 요금제’ 선봬

      뉴스탭 13:50:10
      읽음 49 공감 1
    • OpenAI, ‘AI 강국 한국’ 청사진 제시… 삼성·SK와 글로벌 프로젝트 본격화

      뉴스탭 13:50:07
      읽음 55 공감 1
    • “AI가 동료로 합류했다”,,, 노션, 차세대 워크스페이스 ‘Notion 3.0’ 공개

      뉴스탭 13:49:54
      읽음 55
    • “위스키와 미식의 완벽한 조화”… 발베니, 와인웍스 한정 스페셜 페어링 공개

      뉴스탭 13:49:43
      읽음 43
    • 포르쉐, 800V 전기 SUV ‘카이엔 일렉트릭’ 공개 임박… WLTP 600km

      오토헤럴드 13:36:42
      읽음 192 공감 1
    • 테슬라 로드스터, 8년 만에 부활 예고… 수석 디자이너 양산 시사

      오토헤럴드 13:36:39
      읽음 207 공감 1
    • 애스턴마틴의 부동산 컬렉션 최신작, 데이토나비치에 럭셔리 주거단지 개발

      오토헤럴드 13:36:35
      읽음 47
    • 전세계 현대차 정비사들 실력 겨룬다 '제15회 월드스킬올림픽' 개최

      오토헤럴드 13:36:33
      읽음 45 공감 1
    • 엔카닷컴, 실제 데이터 활용해 AI 서비스 구현 'AI 개발·기획 공모전' 개최

      오토헤럴드 13:36:30
      읽음 44
    • 테슬라, 사이버트럭 '눈뽕' 논란으로 6만 4000대 리콜… “주차등 밝기 과도”

      오토헤럴드 13:36:27
      읽음 50
    • KGM, 익스피리언스 센터 딜러십 운영 체제로 전환...부산점 첫 도입

      오토헤럴드 13:36:24
      읽음 46
    • 벤츠, 전기차 및 하이브리드 충전 강화 ‘MB.CHARGE 퍼블릭’ 출시

      오토헤럴드 13:36:21
      읽음 50
    • [EV 트렌드] 지프, 레콘 EV 양산 결정…"전기 오프로더 시장 도전"

      오토헤럴드 13:36:19
      읽음 54
    • 자동차 페달오조작 방지장치ㆍ전기차 배터리 잔존수명 표시 의무화 추진

      오토헤럴드 13:36:13
      읽음 48
    • 오너만을 위한 성역, 람보르기니 '더 라운지 도쿄' 탐방기

      글로벌오토뉴스 13:35:53
      읽음 49
    • 미국 풍력 산업, 단기적으로 급반등 예상되나 관세·규제 불확실성 복병

      글로벌오토뉴스 13:35:49
      읽음 41
    • GM, 전기차 판매 급증에도 내연기관차 전환 재개… 인센티브 종료 등 정책 변화 영향

      글로벌오토뉴스 13:35:46
      읽음 49
    • 네덜란드 넥스페리아 장악 사태, 독일 자동차 산업에 칩 공급 위기 촉발

      글로벌오토뉴스 13:35:43
      읽음 49
    • 아우디, G-클래스 대항마 정통 오프로더 개발 시동 걸리나

      글로벌오토뉴스 13:35:40
      읽음 42
    • 테슬라, 3분기 영업이익 40% 급감… 4분기 연속 두 자릿수 감소세

      글로벌오토뉴스 13:35:37
      읽음 49
    • GM, 2028년부터 캐딜락 에스컬레이드 IQ에 눈을 떼는 운전 기술 도입… AI 비서도 탑재

      글로벌오토뉴스 13:35:34
      읽음 40
    • 테슬라, "완전 자율주행 하드웨어 탑재" 약속 대신 "자율성을 위해 설계"로 문구 변경

      글로벌오토뉴스 13:35:31
      읽음 38
    • 메르세데스-벤츠 코리아, 전기 및 하이브리드 차량 고객의 충전 경험 강화를 위한 ‘MB.CHARGE 퍼블릭’ 서비스 출시

      글로벌오토뉴스 13:35:28
      읽음 44
    • KGM, 익스피리언스 센터 ‘딜러십’ 체제로 전환… 프리미엄 고객 경험 강화 나선다

      글로벌오토뉴스 13:35:25
      읽음 42
    • 한성자동차, 문화예술 사회공헌 프로그램 '더 스테이지 한성' 성료

      글로벌오토뉴스 13:35:22
      읽음 31
    • <11월 모바일 출석체크> 11월 출석하고 겨울 맞이 선물 받기!

    • 3년 만에 외쳐 봅니다. 도와줘요 조립맨~~

    • 환한 웃음이 가득한 추석 명절 보내세요!

    스폰서 PICK

    이전 페이지 3/5 다음 페이지
    • 엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스
    • 알파스캔 AOC Q27G4/D 게이밍 FAST IPS 200 QHD HDR 400 멀티스탠드 무결점

      알파스캔 AOC Q27G4/D 게이밍 FAST IPS 200 QHD HDR 400 멀티스탠드 무결점

      알파스캔
    • Antec FLUX PRO MESH(블랙)

      Antec FLUX PRO MESH(블랙)

      Antec
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코
    • 1stPlayer Mi5(블랙)

      1stPlayer Mi5(블랙)

      1stPlayer
    • 인텔 코어 울트라7 시리즈2 265K (애로우레이크)(정품)

      인텔 코어 울트라7 시리즈2 265K (애로우레이크)(정품)

      인텔
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • 마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스
    • AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩 정품)

      AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩 정품)

      AMD
    • 엔티스 배너
    • AMD
    • 다크플래쉬
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 1
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5909202 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.