로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2004-서울양천-00918호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 여행매거진 트래비TV
      오토기어
    • 잘컴TV
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • Allthatboots TV
      DmonkTV
    • Hakbong Kwon
      Motorgraph
    • PC SNAP
      Producer dk
    • THE EDIT
      UnderKG
    • 다나와 공식채널
      다나와 2TV
    • 노리다
      샵다나와 조립갤러리
    >
    이전 글
    다음 글
    AI matters

    메타, 기존 통념 뒤집는 연구 결과 공개… “추론 시간 짧으면 LLM 정확도 34.5% 향상”

    2025.06.04. 12:49:00
    읽음79

    Don't Overthink it. Preferring Shorter Thinking Chains for Improved LLM Reasoning


    기존 통념을 뒤집는 발견: 짧은 추론이 34.5% 더 정확

    복잡한 수학 문제를 해결하는 대형언어모델(LLM)에서 긴 추론 과정이 반드시 더 나은 성능을 보장하지 않는다는 연구 결과가 발표됐다. 메타(Meta)와 히브리대학교 공동 연구진이 발표한 논문에 따르면, 오히려 짧은 추론 과정이 최대 34.5% 더 정확한 결과를 도출하는 것으로 나타났다. 연구진은 3개의 주요 추론 LLM인 라마-3.3-네모트론-슈퍼-49B(Llama-3.3-Nemotron-Super-49B), R1-디스틸-콰인-32B(R1-Distill-Qwen-32B), QwQ-32B를 대상으로 실험을 진행했다. 각 모델에 동일한 수학 문제를 20회씩 풀게 한 뒤, 가장 짧은 답안과 가장 긴 답안의 정확도를 비교 분석했다.

    실험 결과는 놀라웠다. 가장 짧은 추론 과정을 거친 답안이 무작위로 선택한 답안보다 최대 18.8% 더 높은 정확도를 보였으며, 가장 긴 추론 과정을 거친 답안보다는 무려 34.5% 더 정확했다. 특히 짧은 추론 과정은 무작위 선택 대비 50%, 긴 추론 대비 67% 더 적은 토큰을 사용하면서도 이런 성과를 달성했다.


    short-m@k 방법론: 병렬 처리로 효율성과 정확성 동시 확보

    이러한 발견을 바탕으로 연구진은 'short-m@k'라는 새로운 추론 방법을 제안했다. 이 방법은 k개의 독립적인 생성 과정을 병렬로 실행하다가, 첫 번째 m개의 추론 과정이 완료되는 즉시 모든 계산을 중단하는 방식이다. 최종 답안은 이 m개의 짧은 추론 과정에서 다수결 투표로 결정된다.

    실험에서 short-1@k 방법은 저연산 환경에서 기존의 다수결 투표 방식과 비슷하거나 더 우수한 성능을 보이면서도 추론 토큰을 최대 40% 절약했다. short-3@k 방법은 모든 연산 예산에서 일관되게 다수결 투표를 능가했으며, 처리 시간을 최대 33% 단축시켰다.

    실험 데이터: AIME와 HMMT 벤치마크에서 일관된 결과

    연구진은 AIME 2024, AIME 2025, HMMT 2025년 2월 등 3개의 경쟁적인 수학 벤치마크를 사용해 실험을 진행했다. 각 벤치마크는 30개의 다양한 난이도 문제로 구성됐으며, 총 5,400개의 답안을 생성해 분석했다. 흥미롭게도 어려운 문제일수록 더 많은 토큰을 사용하는 경향을 보였지만, 동일한 문제 내에서는 정답이 오답보다 더 짧은 추론 과정을 거치는 것으로 나타났다. 예를 들어, LN-Super-49B 모델의 경우 쉬운 문제에서 정답은 평균 5,300개 토큰을 사용한 반면 오답은 11,100개 토큰을 사용했다.

    짧은 추론 데이터로 훈련하면 성능도 향상

    연구진은 추가로 콰인-2.5-32B(Qwen-2.5-32B) 모델을 짧은 추론, 긴 추론, 무작위 추론 데이터로 각각 파인튜닝했다. 그 결과 짧은 추론 데이터로 훈련한 모델이 다른 두 모델보다 더 나은 성능을 보였다. S1-short 모델은 S1-random 모델 대비 2.8% 높은 정확도를 달성하면서도 추론 토큰을 5.8% 적게 사용했다. 반면 긴 추론 데이터로 훈련한 S1-long 모델은 더 많은 토큰을 소모했지만 성능 향상은 미미했다. 이는 훈련 단계에서부터 짧은 추론을 활용하는 것이 효율성과 정확성을 동시에 개선할 수 있음을 시사한다.

    병렬 처리 의존성과 메모리 제약이라는 한계점

    이번 연구의 short-m@k 방법론은 뛰어난 성과를 보였지만 몇 가지 제약사항도 존재한다. 가장 큰 한계는 배치 디코딩(batch decoding)에 의존한다는 점이다. 이 방법은 여러 추론 과정을 동시에 병렬로 실행해야 하므로, 추론 메모리가 제한된 환경에서는 적용이 어려울 수 있다.

    연구진은 병렬 처리 없이도 short-m@k를 사용할 수 있지만, 이 경우 효율성 개선 효과가 줄어든다고 밝혔다. 또한 이번 파인튜닝 실험은 특정 모델(콰인-2.5-32B-인스트럭트)과 데이터셋(S1)에 한정되어 진행됐기 때문에, 다른 모델과 데이터셋에서도 동일한 효과를 보일지는 추가 검증이 필요하다.

    FAQ

    Q: 왜 짧은 추론이 더 정확한 결과를 낳나요?

    A: 연구진은 긴 추론 과정이 오히려 모델을 혼란스럽게 만들고 잘못된 경로로 이끌 수 있다고 분석했습니다. 짧은 추론은 핵심적인 문제 해결 과정에 집중하여 더 직접적이고 정확한 답안을 도출합니다.

    Q: short-m@k 방법은 어떤 상황에서 가장 효과적인가요?

    A: 이 방법은 특히 연산 자원이 제한된 환경에서 뛰어난 효과를 보입니다. 병렬 처리가 가능한 환경에서 사용할 때 최대 40%의 연산 비용을 절약하면서도 더 높은 정확도를 달성할 수 있습니다.

    Q: 이 연구 결과가 실제 AI 서비스에 어떤 영향을 미칠까요?

    A: 이 연구는 AI 서비스의 연산 비용을 크게 줄이면서도 성능을 향상시킬 수 있는 방법을 제시합니다. 특히 수학 문제 해결, 코딩, 논리적 추론이 필요한 AI 애플리케이션에서 효율성과 정확성을 동시에 개선할 수 있을 것으로 기대됩니다.


    해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

    이미지 출처: 이디오그램 생성




    AI Matters 뉴스레터 구독하기
    태그
    메타 통념 뒤집는 연구 결과 추론 시간 LLM 정확도
    안내 ?

    말 많은 뉴스

    • 1

      파워서플라이의 라인업을 보면 제조사의 노하우가 보인다 [라인업을보자]

      댓글12
      파워서플라이의 라인업을 보면 제조사의 노하우가 보인다 [라인업을보자]
    • 2

      갑자기 튀어 나온 One UI 8 베타 바뀐 점 정리

      댓글12
      갑자기 튀어 나온 One UI 8 베타 바뀐 점 정리
    • 3

      초경량 노트북으로 이런 게임을? 최신 노트북 내장 그래픽 성능은?

      댓글10
      초경량 노트북으로 이런 게임을? 최신 노트북 내장 그래픽 성능은?
    • 4

      크리에이터와 게이머를 위한 최적의 선택 ‘다나와 6월 표준 노트북’

      댓글9
      크리에이터와 게이머를 위한 최적의 선택 ‘다나와 6월 표준 노트북’
    • 5

      올여름 내내 덥고 비도 많이 온다고? 제습기 vs 물먹는하마 고민된다면

      댓글9
      올여름 내내 덥고 비도 많이 온다고? 제습기 vs 물먹는하마 고민된다면

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • '번아웃' 고백한 김비오, KPGA 부산오픈 첫날 단독 선두(종합)

      연합뉴스 25.06.05.
      읽음 41 공감 8
    • 크로스오버존 '34WP165 커브드 리얼 165 울트라와이드 멀티스탠드' 무결점 업그레이드 이벤트

      다나와 25.06.05.
      읽음 57 공감 8
    • 서린씨앤아이, 클레브 DDR5 RGB 메모리 구성 완제 PC 구매 시 사은품 증정

      다나와 25.06.05.
      읽음 67 공감 8
    • 골프 전문 여행사 자이언트골프, 박민지 등 선수 5명 후원

      연합뉴스 25.06.05.
      읽음 42 공감 8
    • "여전히 비싸고 정책 오락가락" 美 전기차 구매 의향 2019년 이후 최저

      오토헤럴드 25.06.05.
      읽음 52 공감 8
    • 현대차, 부산시에 무공해 수소청소차 공급… "2028년까지 65대 전환"

      오토헤럴드 25.06.05.
      읽음 55 공감 8
    • [가이드] “‘도감작’을 아시나요?” 쏠쏠하게 써먹는 서머너즈 워 러쉬 팁&쿠폰 모음!

      게임동아 25.06.05.
      읽음 52 공감 8
    • 골프존, 싱가포르에 대형 골프 시뮬레이터 센터 2곳 개장

      연합뉴스 25.06.05.
      읽음 45 공감 8
    • '번아웃' 고백한 김비오, KPGA 부산오픈 첫날 6언더파

      연합뉴스 25.06.05.
      읽음 52 공감 8
    • KLPGA 상금·대상 포인트 선두 이예원 "올해 목표는 4승 이상"

      연합뉴스 25.06.05.
      읽음 48 공감 8
    • KLPGA 사상 첫 5연패 노리는 박민지 "감사한 마음으로 도전"

      연합뉴스 25.06.05.
      읽음 38 공감 8
    • 3,000명 출전, 전국 장애학생 e페스티벌 예선 시작

      게임메카 25.06.05.
      읽음 64 공감 12 댓글 1
    • [순위분석] 4년 만에, 리니지가 리니지 2에 밀렸다

      게임메카 25.06.05.
      읽음 51 공감 8
    • [Q&AI] 이재명 정부 ‘AI 정책수석’ 후보 4명 누구?

      AI matters 25.06.05.
      읽음 53 공감 9 댓글 1
    • AI가 최고의 '노이즈'를 찾아낸다... 삼성, 비디오 품질 높이는 ‘ANSE’ 기술 공개

      AI matters 25.06.05.
      읽음 49 공감 9 댓글 1
    • 백송홀딩스-아시아드CC 부산오픈 개막

      연합뉴스 25.06.05.
      읽음 64 공감 8
    • OECD가 제시한 AI 능력 측정 새 기준, 정책 결정을 위한 종합 프레임워크 공개

      AI matters 25.06.05.
      읽음 40 공감 8
    • 알리바바, 12만 토큰 고맥락 거대 문서도 척척 이해하는 AI '큐원롱-L1' 공개... “오픈AI o3-mini 성능 뛰어넘어”

      AI matters 25.06.05.
      읽음 45 공감 8
    • '팀장님 필독', MS가 만든 ‘회의 목적 찾아주는’ AI는 회의 지옥에서 구출해 준다

      AI matters 25.06.05.
      읽음 43 공감 9
    • "누군가의 자유 침해하면 안 돼" 이해 못 하는 AI… 2,500개 상황서 도덕 테스트한 결과

      AI matters 25.06.05.
      읽음 44 공감 8
    • 젤다·마리오 등, 닌텐도 게임 일동 스위치 2 대비 완료

      게임메카 25.06.05.
      읽음 122 공감 2
    • 테슬라, 모델 Y 로보택시 시험 운행 중… 일론 머스크 "사고는 없었다" 

      오토헤럴드 25.06.05.
      읽음 51 공감 1
    • 독일, 비내연기관차 비중 52.4%로 급성장… 테슬라, 홀로 36.2% 감소

      오토헤럴드 25.06.05.
      읽음 55 공감 1
    • 국내 자동차 업계 가장 흔한 비밀번호 ‘123456’…사이버 해킹 무방비

      오토헤럴드 25.06.05.
      읽음 55 공감 2
    • KGM, 카테나엑스 기반 제품탄소발자국 시스템 구축 글래스돔과 계약 체결

      오토헤럴드 25.06.05.
      읽음 44 공감 1
    • ‘레이밴 끼고 랭글러 타는 낭만의 완성'...지프 라이드 유어 드림 캠페인

      오토헤럴드 25.06.05.
      읽음 49 공감 1
    • "大이변" 테슬라, 벤츠ㆍBMW 제치고 5월 수입차 등록 사상 첫 1위 등극

      오토헤럴드 25.06.05.
      읽음 55 공감 1
    • 이스즈, 국내 누적 3000호차 5톤 포워드 극초장축 모델 인도

      오토헤럴드 25.06.05.
      읽음 46 공감 1
    • 346. 유럽과 미국의 정책변화, 전기차의 판도 변화에 영향이 있을까?

      글로벌오토뉴스 25.06.05.
      읽음 49 공감 1
    • F1 부활과 함께 움직이는 자본: CYVN과 맥라렌의 결합

      글로벌오토뉴스 25.06.05.
      읽음 51 공감 1
    • 인도, 전기차 생산 투자 조건으로 수입차 관세 대폭 인하...테슬라 유치 총력

      글로벌오토뉴스 25.06.05.
      읽음 46 공감 1
    • 토요타, 액체 수소 GR 코롤라 H2 콘셉트카로 24시간 내구 레이스 도전...충전 속도 30% 향상

      글로벌오토뉴스 25.06.05.
      읽음 38
    • 폭스바겐 카리아드, AI로 나이트 라이더 현실화...아우디 Q6 e-트론에 AI 음성 비서 탑재

      글로벌오토뉴스 25.06.05.
      읽음 41
    • 혼다, AI 활용해 차량 전면 디자인 개발 기간 6개월→수분으로 단축

      글로벌오토뉴스 25.06.05.
      읽음 43
    • 미국 청정 에너지 투자 급증세 '주춤'...의회 예산안 통과 시 '먹구름'

      글로벌오토뉴스 25.06.05.
      읽음 37
    • 중국 희토류 수출 제한, 글로벌 자동차 산업 '비상'...생산 중단 위기 고조

      글로벌오토뉴스 25.06.05.
      읽음 38
    • 혼다, 4월 글로벌 생산량 12% 감소...일본 및 해외 생산 모두 하락

      글로벌오토뉴스 25.06.05.
      읽음 37
    • 중국 전기차 스타트업 5월 판매 '고공행진'...샤오펑 230%↑, 니오·리프모터도 두 자릿수 성장

      글로벌오토뉴스 25.06.05.
      읽음 35
    • 폴스타, 'SXSW 런던 2025' 독점 자동차 파트너 선정...혁신적 기술 및 지속가능성 선보인다

      글로벌오토뉴스 25.06.05.
      읽음 40
    • 한국타이어, 삼성 라이온즈파크에서 ‘스트라이크존’ 팝업 이벤트 진행

      글로벌오토뉴스 25.06.05.
      읽음 39
    • 포르쉐코리아, 마칸 일렉트릭과 함께 하는 ‘포르쉐 커뮤니티 밋업’ 개최

      글로벌오토뉴스 25.06.05.
      읽음 37
    • 한국자동차기자협회, 6월의 차에 폭스바겐 신형 아틀라스 선정

      글로벌오토뉴스 25.06.05.
      읽음 31
    • 지프, 자유를 꿈꾸는 이들을 위한 “라이드 유어 드림” 캠페인 전개

      글로벌오토뉴스 25.06.05.
      읽음 28
    • 메르세데스-벤츠 코리아, 장마철 수해 차량 대상 특별 지원 프로그램 운영

      글로벌오토뉴스 25.06.05.
      읽음 26
    • KGM, 제품탄소발자국 시스템 구축 위해 글래스돔과 계약 체결

      글로벌오토뉴스 25.06.05.
      읽음 25
    • [오늘의 스팀] 최적화 굿! 스텔라 블레이드 ‘매우 긍정적’

      게임메카 25.06.05.
      읽음 33 공감 2 댓글 1
    • 던파, 신규 전직 ‘키메라&‘패러메딕’ 업데이트

      게임동아 25.06.05.
      읽음 53
    • "타이틀에 한글이 들어간다?" 콜오브듀티 신작 배경 유출 화제

      게임동아 25.06.05.
      읽음 51 공감 2 댓글 1
    • 웹젠, 서브컬처 신작 테르비스 10일부터 일주일간 CBT 진행

      게임동아 25.06.05.
      읽음 40
    • 2025 인디크래프트, 우수 선정작 'TOP 70' 발표

      게임동아 25.06.05.
      읽음 47
    • 역시나 꽝 없는 공유하기. 이번에는 라데온이다 우오오오~

    • 포인트 룰렛 돌리고 10초 만에 당첨 확인하세요!

    • [5.31~] AMD 라이젠7-5세대 7700X (라파엘) (테스트 사용 제품)

    스폰서 PICK

    이전 페이지 1/5 다음 페이지
    • 엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스
    • 알파스캔 AOC Q27G4 게이밍 IPS 180 프리싱크 HDR 400 무결점

      알파스캔 AOC Q27G4 게이밍 IPS 180 프리싱크 HDR 400 무결점

      알파스캔
    • Antec FLUX PRO MESH(블랙)

      Antec FLUX PRO MESH(블랙)

      Antec
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코
    • 1stPlayer Mi5(블랙)

      1stPlayer Mi5(블랙)

      1stPlayer
    • 인텔 코어 울트라7 시리즈2 265K (애로우레이크)(정품)

      인텔 코어 울트라7 시리즈2 265K (애로우레이크)(정품)

      인텔
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • 마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스
    • AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩(정품))

      AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩(정품))

      AMD
    • 잘만
    • 알파스캔 (3개월진행 : 4/8-7/8)
    • 명성(인텔)
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2004-서울양천-00918호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5823118 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.