로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 쿠팡
    • 옥션
    • 11번가
    • LG전자
    • 하이마트
    • 전자랜드
    • 롯데아이몰
    • SSG
    • CJ 온스타일
    • GS샵
    • 롯데닷컴(롯데온)
    • 현대Hmall
    • 이마트몰
    • SK스토아
    • 더현대닷컴
    • 엘롯데
    • 신세계몰
    • NS몰
    • 홈플러스
    • 공영쇼핑
    • 홈앤쇼핑
    • 신세계 라이브쇼핑
    • 오늘의 집
    • 배민상회
    • 동원몰
    • LF몰
    • ZETTA몰
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    메타, 기존 통념 뒤집는 연구 결과 공개… “추론 시간 짧으면 LLM 정확도 34.5% 향상”

    2025.06.04. 12:49:00
    읽음387

    Don't Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning


    기존 통념을 뒤집는 발견: 짧은 추론이 34.5% 더 정확

    복잡한 수학 문제를 해결하는 대형언어모델(LLM)에서 긴 추론 과정이 반드시 더 나은 성능을 보장하지 않는다는 연구 결과가 발표됐다. 메타(Meta)와 히브리대학교 공동 연구진이 발표한 논문에 따르면, 오히려 짧은 추론 과정이 최대 34.5% 더 정확한 결과를 도출하는 것으로 나타났다. 연구진은 3개의 주요 추론 LLM인 라마-3.3-네모트론-슈퍼-49B(Llama-3.3-Nemotron-Super-49B), R1-디스틸-콰인-32B(R1-Distill-Qwen-32B), QwQ-32B를 대상으로 실험을 진행했다. 각 모델에 동일한 수학 문제를 20회씩 풀게 한 뒤, 가장 짧은 답안과 가장 긴 답안의 정확도를 비교 분석했다.

    실험 결과는 놀라웠다. 가장 짧은 추론 과정을 거친 답안이 무작위로 선택한 답안보다 최대 18.8% 더 높은 정확도를 보였으며, 가장 긴 추론 과정을 거친 답안보다는 무려 34.5% 더 정확했다. 특히 짧은 추론 과정은 무작위 선택 대비 50%, 긴 추론 대비 67% 더 적은 토큰을 사용하면서도 이런 성과를 달성했다.


    short-m@k 방법론: 병렬 처리로 효율성과 정확성 동시 확보

    이러한 발견을 바탕으로 연구진은 'short-m@k'라는 새로운 추론 방법을 제안했다. 이 방법은 k개의 독립적인 생성 과정을 병렬로 실행하다가, 첫 번째 m개의 추론 과정이 완료되는 즉시 모든 계산을 중단하는 방식이다. 최종 답안은 이 m개의 짧은 추론 과정에서 다수결 투표로 결정된다.

    실험에서 short-1@k 방법은 저연산 환경에서 기존의 다수결 투표 방식과 비슷하거나 더 우수한 성능을 보이면서도 추론 토큰을 최대 40% 절약했다. short-3@k 방법은 모든 연산 예산에서 일관되게 다수결 투표를 능가했으며, 처리 시간을 최대 33% 단축시켰다.

    실험 데이터: AIME와 HMMT 벤치마크에서 일관된 결과

    연구진은 AIME 2024, AIME 2025, HMMT 2025년 2월 등 3개의 경쟁적인 수학 벤치마크를 사용해 실험을 진행했다. 각 벤치마크는 30개의 다양한 난이도 문제로 구성됐으며, 총 5,400개의 답안을 생성해 분석했다. 흥미롭게도 어려운 문제일수록 더 많은 토큰을 사용하는 경향을 보였지만, 동일한 문제 내에서는 정답이 오답보다 더 짧은 추론 과정을 거치는 것으로 나타났다. 예를 들어, LN-Super-49B 모델의 경우 쉬운 문제에서 정답은 평균 5,300개 토큰을 사용한 반면 오답은 11,100개 토큰을 사용했다.

    짧은 추론 데이터로 훈련하면 성능도 향상

    연구진은 추가로 콰인-2.5-32B(Qwen-2.5-32B) 모델을 짧은 추론, 긴 추론, 무작위 추론 데이터로 각각 파인튜닝했다. 그 결과 짧은 추론 데이터로 훈련한 모델이 다른 두 모델보다 더 나은 성능을 보였다. S1-short 모델은 S1-random 모델 대비 2.8% 높은 정확도를 달성하면서도 추론 토큰을 5.8% 적게 사용했다. 반면 긴 추론 데이터로 훈련한 S1-long 모델은 더 많은 토큰을 소모했지만 성능 향상은 미미했다. 이는 훈련 단계에서부터 짧은 추론을 활용하는 것이 효율성과 정확성을 동시에 개선할 수 있음을 시사한다.

    병렬 처리 의존성과 메모리 제약이라는 한계점

    이번 연구의 short-m@k 방법론은 뛰어난 성과를 보였지만 몇 가지 제약사항도 존재한다. 가장 큰 한계는 배치 디코딩(batch decoding)에 의존한다는 점이다. 이 방법은 여러 추론 과정을 동시에 병렬로 실행해야 하므로, 추론 메모리가 제한된 환경에서는 적용이 어려울 수 있다.

    연구진은 병렬 처리 없이도 short-m@k를 사용할 수 있지만, 이 경우 효율성 개선 효과가 줄어든다고 밝혔다. 또한 이번 파인튜닝 실험은 특정 모델(콰인-2.5-32B-인스트럭트)과 데이터셋(S1)에 한정되어 진행됐기 때문에, 다른 모델과 데이터셋에서도 동일한 효과를 보일지는 추가 검증이 필요하다.

    FAQ

    Q: 왜 짧은 추론이 더 정확한 결과를 낳나요?

    A: 연구진은 긴 추론 과정이 오히려 모델을 혼란스럽게 만들고 잘못된 경로로 이끌 수 있다고 분석했습니다. 짧은 추론은 핵심적인 문제 해결 과정에 집중하여 더 직접적이고 정확한 답안을 도출합니다.

    Q: short-m@k 방법은 어떤 상황에서 가장 효과적인가요?

    A: 이 방법은 특히 연산 자원이 제한된 환경에서 뛰어난 효과를 보입니다. 병렬 처리가 가능한 환경에서 사용할 때 최대 40%의 연산 비용을 절약하면서도 더 높은 정확도를 달성할 수 있습니다.

    Q: 이 연구 결과가 실제 AI 서비스에 어떤 영향을 미칠까요?

    A: 이 연구는 AI 서비스의 연산 비용을 크게 줄이면서도 성능을 향상시킬 수 있는 방법을 제시합니다. 특히 수학 문제 해결, 코딩, 논리적 추론이 필요한 AI 애플리케이션에서 효율성과 정확성을 동시에 개선할 수 있을 것으로 기대됩니다.


    해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

    이미지 출처: 이디오그램 생성




    AI Matters 뉴스레터 구독하기
    태그
    메타 통념 뒤집는 연구 결과 추론 시간 LLM 정확도
    안내 ?

    말 많은 뉴스

    • 1

      쏘렌토보다 싼 '헐값' 비상식적 카드 꺼낸 'BYD'.... 프리미엄 '양왕' 검토

      댓글9
      쏘렌토보다 싼 '헐값' 비상식적 카드 꺼낸 'BYD'.... 프리미엄 '양왕' 검토
    • 2

      천장에 붙이는 와이파이7, 병목은 2.5Gbps로 걷어냈다... ipTIME Ring-BE3600plus

      댓글6
      천장에 붙이는 와이파이7, 병목은 2.5Gbps로 걷어냈다... ipTIME Ring-BE3600plus
    • 3

      스팀머신 한대 팔면 얼마나 남을까?

      댓글4
      스팀머신 한대 팔면 얼마나 남을까?
    • 4

      2026 부산모터쇼 - 기아의 '맞춤형 공간'과 현대차의 '지능형 세단'

      댓글4
      2026 부산모터쇼 - 기아의 '맞춤형 공간'과 현대차의 '지능형 세단'
    • 5

      최악의 결정을 한 BMW "전기차 포기할 생각인가?"

      댓글4
      최악의 결정을 한 BMW "전기차 포기할 생각인가?"

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 롤 TCG 리프트바운드, T1 우승 기념 컬렉션 공개

      게임메카 26.07.03.
      읽음 134 공감 11 댓글 1
    • 대통령배 아마추어 e스포츠 대회, 광주 대표 선발전 모집

      게임메카 26.07.03.
      읽음 133 공감 10
    • 소프트뱅크, 오픈AI 지분 담보 15조 원 대출 협상 재개…기업 보증 추가

      AI matters 26.07.03.
      읽음 100 공감 10
    • 구글 탄소배출 1년 새 25% 급증…아마존도 16% 늘었다

      AI matters 26.07.03.
      읽음 113 공감 12 댓글 2
    • AI 데이터센터 크루소, 4조 7천억 원 조달 협의…기업가치 46조 원 거론

      AI matters 26.07.03.
      읽음 118 공감 11 댓글 1
    • 테슬라, 직원 AI 지출 주 31만 원으로 제한…xAI 제품은 예외

      AI matters 26.07.03.
      읽음 100 공감 10
    • 오픈AI, 미 정부에 지분 5% 제안…66조 원 규모

      AI matters 26.07.03.
      읽음 116 공감 10
    • [오늘의 스팀] 새로운 안전지대? 러스트 ‘아파트’ 생겼다

      게임메카 26.07.03.
      읽음 143 공감 12
    • 소니에 이어, MS도 Xbox에서 실물 디스크 없앤다?

      게임메카 26.07.03.
      읽음 124 공감 12
    • [리뷰] 독특한 구성 속 탄탄한 기본기, 에이수스 프로아트 PZ14

      IT동아 26.07.03.
      읽음 872 공감 18
    • "10년 타기는 옛 말" 폐차 직전까지 21만km... LPG, 가장 오래 타는 차

      오토헤럴드 26.07.03.
      읽음 130 공감 11 댓글 1
    • 현대차·기아, 美 상반기 88만대 돌파... 하이브리드로 역대급 기록

      오토헤럴드 26.07.03.
      읽음 126 공감 11 댓글 1
    • 트럼프, USMCA 연장 거부 '자동차 원산지 규정 강화 가능성'

      오토헤럴드 26.07.03.
      읽음 111 공감 10
    • "브레이크 페달 없는 테슬라 나온다" 美 자율주행 규제 대수술

      오토헤럴드 26.07.03.
      읽음 124 공감 10
    • 기아, 해양 폐플라스틱 EV3 트렁크 매트로 재탄생…오션클린업 협력 확대

      오토헤럴드 26.07.03.
      읽음 112 공감 10
    • [EV 트렌드] 'EV9·아이오닉 9 정조준' 테슬라 모델 Y L 미국 판매 시작

      오토헤럴드 26.07.03.
      읽음 123 공감 10
    • 지커, 유럽서 EREV 카드 '들썩' 전기차 시장 둔화에 전략 수정

      오토헤럴드 26.07.03.
      읽음 118 공감 10
    • 테슬라 독주·BYD 돌풍…6월 수입차 시장 판도 바꾼 전기차 50% 돌파

      오토헤럴드 26.07.03.
      읽음 109 공감 10
    • 스텔란티스코리아, 개소세 인하 종료 대응 지프·푸조 7월 특별 프로모션 전개

      글로벌오토뉴스 26.07.03.
      읽음 104 공감 10
    • 가상 세계에서 태어나는 자동차, 현대차 남양연구소 AMS동을 가다

      글로벌오토뉴스 26.07.03.
      읽음 121 공감 11 댓글 1
    • 캐나다·중국 관세 장벽 완화… 지리자동차 로터스 EV 이 달 첫 상륙

      글로벌오토뉴스 26.07.03.
      읽음 120 공감 10
    • 철도 선로 사이 틈새 메운 태양광 패널… 토지 파괴 없는 이중 용도 인프라 혁신

      글로벌오토뉴스 26.07.03.
      읽음 121 공감 11 댓글 1
    • 미국 코넬대, 배터리 비용 56% 줄이는 DEER 공법 개발

      글로벌오토뉴스 26.07.03.
      읽음 117 공감 11 댓글 1
    • 토요타와 조비 에비에이션 전기 비행 택시 합작회사 설립

      글로벌오토뉴스 26.07.03.
      읽음 123 공감 10 댓글 1
    • 중국 체리자동차, 4개 독립 브랜드 앞세워 영국시장 확대

      글로벌오토뉴스 26.07.03.
      읽음 100 공감 7
    • 중국, 세계 최고 수준 전기차 및 배터리 안전 기준 시행… 화재·폭발 제로화 조치

      글로벌오토뉴스 26.07.03.
      읽음 101 공감 7
    • 노르웨이 전기차 등록 대수 100만 대 돌파, 상반기 전기차 점유율 97.6%

      글로벌오토뉴스 26.07.03.
      읽음 109 공감 1
    • 피아트, 토폴리노/트리스/멀티플리나 등 도심 마이크로모빌리티 라인업 발표

      글로벌오토뉴스 26.07.03.
      읽음 91 공감 1
    • BYD, 2분기 전 세계 판매 1위 탈환…상반기 전체 판매는 6년만에 감소

      글로벌오토뉴스 26.07.03.
      읽음 94 공감 1
    • 중국차, 유럽 시장서 처음으로 일본차 추월… BYD가 선두 견인

      글로벌오토뉴스 26.07.03.
      읽음 100 공감 1
    • 브리지스톤 코리아, 상용차 타이어 구매 고객 대상 경품 프로모션 ‘타또’ 진행

      글로벌오토뉴스 26.07.03.
      읽음 103 공감 1
    • 6월 수입 승용차 신규 등록 3만8059대 기록, 전년 동월 대비 37.0% 급증

      글로벌오토뉴스 26.07.03.
      읽음 101 공감 1
    • 메르세데스-벤츠 공식 딜러 한성모터스, 여름맞이 고객 감사 캠페인 실시

      글로벌오토뉴스 26.07.03.
      읽음 104 공감 1
    • 폴스타코리아, 배우 김우빈과 함께한 ‘폴스타 3’ TVC 온에어 및 국내 출시 캠페인 본격화

      글로벌오토뉴스 26.07.03.
      읽음 98 공감 1
    • 아우디 코리아, FC 바이에른 뮌헨 친선 경기 ‘플레이어 에스코트’ 어린이 모집

      글로벌오토뉴스 26.07.03.
      읽음 101 공감 1
    • 한국타이어 아이온 레이스, 포뮬러 E 시즌 12 상하이 더블헤더 출격

      글로벌오토뉴스 26.07.03.
      읽음 98 공감 1
    • 기아, 오션클린업에 전기차 4대 추가 지원…해양 폐플라스틱 재자원화 확대

      글로벌오토뉴스 26.07.03.
      읽음 88 공감 1
    • 르노코리아, 찾아가는 ‘차가옴 시승서비스’ 및 openR 게임 대회 개최

      글로벌오토뉴스 26.07.03.
      읽음 107 공감 1
    • 미국 6월 경상용차 시장, 전년 대비 7.9% 성장… 137만 대 판매 기록

      글로벌오토뉴스 26.07.03.
      읽음 103 공감 1
    • 메르세데스-벤츠 코리아, 전국 서비스센터서 ‘수해 차량 특별 지원 프로그램’ 운영

      글로벌오토뉴스 26.07.03.
      읽음 92 공감 1
    • 토요타, 렉서스 전기 세단 LF-ZC 개발 전격 취소…부품사에 수백억 엔 보상

      글로벌오토뉴스 26.07.03.
      읽음 89 공감 1
    • 고유가 직격탄 맞은 아시아 자동차 시장, 에너지 위기가 불러온 판도 변화

      글로벌오토뉴스 26.07.03.
      읽음 75 공감 1
    • 중국 보상판매 보조금 정률제 전환, 자동차 시장 고부가가치 중심 재편 촉진

      글로벌오토뉴스 26.07.03.
      읽음 90 공감 1
    • "단순 녹화는 끝났다" 블랙박스 업계 구세대 AI 버려야 사는 이유

      글로벌오토뉴스 26.07.03.
      읽음 1,580 공감 12 댓글 3
    • 스마일게이트, 2026 애니메 엑스포서 ‘카제나’·‘미래시’ 부스 오픈

      게임동아 26.07.03.
      읽음 102 공감 1
    • 고립된 것은 몸일까, 마음일까? 이야기를 담은 방탈출 '아이솔레이션'

      게임동아 26.07.03.
      읽음 97 공감 1
    • 하이브로, '드래곤빌리지3' 14년 뚝심으로 애플 매출 2위 등 '조용한 돌풍'

      게임동아 26.07.03.
      읽음 97 공감 1
    • 모바일게임 출시량 전년比 2배 급증, 원인은 '바이브 코딩'

      게임메카 26.07.03.
      읽음 102 공감 3 댓글 1
    • 에픽게임즈, 고전 SF 호러 ‘나는 입이 없다...’ 무료 배포

      게임메카 26.07.03.
      읽음 96 공감 4 댓글 1
    • [이구동성] 떠나는 ‘미르’

      게임메카 26.07.03.
      읽음 104 공감 4 댓글 1
    • [07.06~07.19] darkFlash GD68 유무선 기계식 (별빛 파랑)

    • <7월 모바일 출석체크> 7월 출석하고 선물받기

    • [여름맞이] 댓글로 FLEX! 창고 대방출

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 뉴런글로벌(안텍)(12월분까지 진행 : 4/16-26년 1/16)
    • 앱코
    • MICRONICS
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 6
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5823118 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.