2+3=X를 위해 13번 고민하는 AI... 텐센트, AI 모델의 '오버씽킹' 현상 분석 : 다나와 DPG는 내맘을 디피지

Do NOT Think That Much for 2+3=? On the Overthinking of o1-Like LLMs

중국의 기술 기업 텐센트가 설립한 AI랩과 상하이자오통대학교 연구진이 발표한 최신 논문에 따르면, 최근 주목받고 있는 오픈AI(OpenAI)의 o1 모델과 유사한 AI 모델들이 단순한 문제 해결에도 과도한 연산 자원을 사용하는 '오버씽킹(overthinking)' 현상을 보이는 것으로 나타났다. 이들 o1류 모델들은 인간과 같이 장시간 생각하는 방식을 모방해 문제 해결 능력을 향상시키고 있지만, 이 과정에서 불필요한 자원 낭비가 발생하고 있다는 것이 연구진의 분석이다.

AI 모델의 비효율적 사고방식 발견

연구진은 '2 더하기 3은 얼마인가?'라는 간단한 질문을 던졌을 때, 기존 AI 모델들은 평균 7개의 토큰만을 사용해 답을 도출한 반면, o1류 모델들은 최대 936개의 토큰을 사용하며 같은 답에 도달하는 것을 확인했다. 이는 기존 모델 대비 1,953% 많은 연산 자원을 소비하는 것이다. 특히 QwQ-32B-Preview 모델의 경우 하나의 문제에 대해 13가지의 서로 다른 해결 방식을 제시했는데, 기본적인 산술 계산부터 시작해 작은 단계로 나누기, 사과 개수 세기 등의 실제 물체 비유, 이진법과 로마 숫자 변환을 통한 검증, 심지어 대수적 방정식 활용까지 다양한 접근법을 시도했다. 연구진은 이러한 현상이 모델의 추론 및 의사결정 과정에서의 근본적인 한계를 보여준다고 지적했다.

효율성 평가를 위한 새로운 지표 도입

연구진은 AI 모델의 효율성을 평가하기 위해 결과(outcome) 관점과 과정(process) 관점의 두 가지 새로운 평가 지표를 제시했다. 결과 효율성 지표(ξO)는 정답을 찾는 데 필요한 최소 토큰 수와 실제 사용된 토큰 수의 비율을 측정하며, 과정 효율성 지표(ξP)는 해결 과정의 다양성과 중복성을 평가한다. 연구 결과 92% 이상의 경우에서 첫 번째 해결 시도에서 이미 정답을 찾았음에도 불구하고, 모델은 계속해서 새로운 해결 방식을 시도하며 불필요한 연산을 수행했다.

난이도별 모델 성능과 오버씽킹 패턴

연구진은 다양한 난이도의 수학 문제 데이터셋을 활용해 실험을 진행했다. 초등학교 수준의 ASDIV(2,305개 문제), 중학교 수준의 GSM8K(1,319개 문제), 고등학교 수학 경시대회 수준의 MATH500 등이 활용됐다. 흥미롭게도 o1류 모델들은 쉬운 문제일수록 더 많은 해결 방식을 시도하는 경향을 보였다. QwQ-32B-Preview 모델은 ASDIV 테스트에서 평균 3.6개의 해결책을 제시한 반면, MATH500에서는 2.8개를 제시했다. 특히 MATH500의 난이도 1-2 단계에서는 평균 3.75회의 해결 시도를, 4-5 단계에서는 3.0회의 시도를 보여 난이도가 낮을수록 오버씽킹이 심해지는 것으로 나타났다.

효율성 향상을 위한 해결책 제시

연구진은 이러한 비효율성을 개선하기 위해 여러 최적화 방법을 제안했다. 감독형 미세조정(SFT), 직접 선호도 최적화(DPO), 추론 선호도 최적화(RPO), 단순 선호도 최적화(SimPO) 등의 방법을 시도했으며, 특히 First-Correct Solutions(FCS), FCS+Reflection, Greedily Diverse Solutions(GDS) 등의 전략을 통해 효율성 개선을 도모했다. 이를 통해 QwQ-32B-Preview 모델은 MATH500 테스트셋에서 토큰 생성량을 48.6% 줄이면서도 정확도를 유지했다. 더 어려운 문제를 다루는 GPQA에서는 토큰 사용량을 32.7% 줄이면서 정확도를 58.6%에서 59.1%로 향상시켰다.

연구의 한계와 향후 과제

현재 이 연구는 QwQ-32B-Preview와 DeepSeek-R1-Preview 두 모델만을 분석했다는 한계가 있다. 또한 솔루션 다양성 측정을 위해 GPT-4o를 사용한 점도 비용과 재현성 측면에서 한계로 지적됐다. 연구진은 향후 문제 복잡도에 따라 동적으로 조정되는 연산 전략 개발, 더 넓은 모델 일반화를 위한 효율성 지표 개선, 100만 개 이상의 인스턴스를 포함하는 대규모 데이터셋을 활용한 검증 등을 추진할 계획이라고 밝혔다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

두 비즈니스맨의 관계에 균열이 시작되었다 – 트럼프와 머스크 (3)	글로벌오토뉴스
창안자동차, 상하이 모터쇼서 미래 전략 발표…신에너지·지능화·글로벌 확장 '삼각편대' 구축 (2)	글로벌오토뉴스
닛산, 중국 우한 공장 생산 중단…실적 부진 및 경쟁 심화 영향 (1)	글로벌오토뉴스
BYD, 1분기 순이익 두 배 증가…전기차·하이브리드 판매 호조 (1)	글로벌오토뉴스
메르세데스-마이바흐 S-클래스의 품격, 가장 안락한 퍼스트클래스급 승차감을 제공한다 (1)	글로벌오토뉴스
스트라드비젼-악세라, 자율주행 혁신 가속 위한 전략적 협력 체결	글로벌오토뉴스
중국 자율주행 스타트업 모멘타, 상하이 모터쇼서 글로벌 자동차 브랜드와 대규모 협력 계약	글로벌오토뉴스
비스테온-퀄컴, AI 기반 차세대 콕핏 시스템 공동 개발	글로벌오토뉴스
일렉트로비트-메톡, 소프트웨어 기반 차량 혁신 위해 전략적 파트너십 체결	글로벌오토뉴스
비스테온-볼케이노 엔진, AI 기반 스마트 콕핏 솔루션 공개…차량 내 경험 혁신 예고	글로벌오토뉴스
중국 세레스, 상하이 모터쇼서 지능형 안전 생태계 공개…미래 자동차 안전 표준 제시	글로벌오토뉴스
현대차, 'ACT 엑스포 2025'서 북미 수소 물류시장 본격 공략	글로벌오토뉴스
로터스자동차, 지난해 글로벌 차량 인도대수 74% 증가	글로벌오토뉴스
폴스타, 2025년형 폴스타 2 출시...300대 한정 신규 트림 추가, 4390만원부터	글로벌오토뉴스
프랑스, 전기차 등록 혜택 종료 임박…지역별 최대 750유로 부담 우려	글로벌오토뉴스
유럽연합, 'FULL-MAP' 프로젝트 출범…AI 기반 차세대 배터리 개발 박차	글로벌오토뉴스
메르세데스-벤츠 트럭, eActros 600으로 100km 후진 기네스 기록 도전	글로벌오토뉴스
빈패스트, 4분기 전기차 출하량 143% 급증…글로벌 성장 가속	글로벌오토뉴스
BYD, 초대형 운반선 '선전'호 출항…글로벌 전기차 시장 공략 가속	글로벌오토뉴스
BYD, 1분기 순이익 100% 폭증…해외 시장 공략 가속화	글로벌오토뉴스
테슬라, 모델 3 롱레인지 무보증금 리스 출시	글로벌오토뉴스
알핀 A390, 브랜드 첫 전기 스포츠 패스트백 5월 27일 공개	글로벌오토뉴스
지커, 첫 PHEV 플래그십 SUV '9X' 공개…BMW X7·GLS 겨냥	글로벌오토뉴스
뉴욕주, 다시 테슬라와 충돌…직접판매 제한 논쟁 재점화	글로벌오토뉴스
폭스콘, 미국 EV 시장 진출 본격화…‘모델 C’ 제3 브랜드 통해 출시	글로벌오토뉴스
볼보 EX30, 미국 관세 여파로 생산지 전환	글로벌오토뉴스
메르세데스-AMG, 포르쉐 타이칸 겨냥한 전용 전기 패스트백 6월 공개 예정	글로벌오토뉴스
LG전자, 전기차 충전기 사업 철수 발표 (1)	글로벌오토뉴스
삼성SDI, '미국 관세로 EV 배터리 생산비용 상승 불가피' (1)	글로벌오토뉴스
페라리, 880마력 플러그인 하이브리드 296 스페치알레 공개	글로벌오토뉴스
한국타이어, WRC 4라운드 ‘이슬라스 카나리아스 랠리’서 기술력 입증	글로벌오토뉴스
혼다코리아, 모터스포츠 문화 확산 위한 2025 ‘혼다 원 메이커 레이스’ 1라운드 실시	글로벌오토뉴스
한국타이어, ‘스마트플렉스 DH51’ 출시 기념 프로모션 진행	글로벌오토뉴스
현대오토에버, 클라우드인프라센터장 이경수 상무 영입	글로벌오토뉴스
하만카돈, 기아 EV4에 프리미엄 사운드 시스템 적용	글로벌오토뉴스
한국타이어, 티스테이션 ‘올마이티(all my T)’ 신규 브랜드 필름 공개	글로벌오토뉴스
다쏘시스템, ‘2025 글로벌 3DEXPERIENCE 모드심 서밋’ 성료	글로벌오토뉴스
미쉐린코리아, 태백 스피드웨이서 ‘2025 미쉐린 트랙 데이’ 성료	글로벌오토뉴스
JLR 코리아, 고객 신뢰 강화를 위한 미래 혁신 전략 ‘원(ONE)’ 발표	글로벌오토뉴스
볼보트럭코리아, 지역 초등학생 위한 디지털 디톡스 캠페인 실시	글로벌오토뉴스
스카니아코리아, 창립 30주년 기념 카카오톡 이모티콘 출시 (1)	글로벌오토뉴스
GM 한국사업장, 장애인 운영 베이커리 오픈 2주년 맞아 지역사회 기여 재다짐	글로벌오토뉴스
한국토요타자동차, 커넥트투에서 가정의 달 맞이 ‘GR 익스피리언스 데이’ 이벤트 진행	글로벌오토뉴스
제네시스 - 영국 테이트 모던 파트너십 전시 개막	글로벌오토뉴스
BMW 코리아 미래재단, 어린이날 맞아 전국 곳곳에서 다양한 체험형 교육 프로그램 진행	글로벌오토뉴스
한성모터스, ‘메르세데스 트로피 2025 한성모터스 지역 예선’ 성료	글로벌오토뉴스
벤틀리 16대 한정 코치빌트 모델 바투르 컨버터블, 두바이서 세계 최초 실물 공개	글로벌오토뉴스
푸조, 고객 대상 첫 공식 이벤트 ‘308 국도 로드 트립’ 개최	글로벌오토뉴스
혼다코리아, 대전 지역 모터사이클 신규 딜러 MOU 체결	글로벌오토뉴스
한국자동차연구원, '탄소중립 모빌리티 센터' 준공	글로벌오토뉴스
트럼프 대통령, 자동차 부품 관세 부담 완화 조치 발표	글로벌오토뉴스
지엠한마음재단, 농촌 일손 돕기 봉사활동 “강화로 오시겨” 진행	글로벌오토뉴스
기아 서상배 선임 오토컨설턴트, 4천대 판매 ‘그랜드 마스터’ 등극	글로벌오토뉴스
기아, 글로벌 인재 채용 플랫폼 '기아 탤런트 라운지' 개설	글로벌오토뉴스
아우디 코리아, ‘더 뉴 아우디 A5’ 국내 최초 공개 및 사전계약 개시 (2)	글로벌오토뉴스
페라리 12칠린드리, 2025 iF 디자인 어워드 골드 수상…자동차 부문 유일 (3)	글로벌오토뉴스
만트럭버스코리아, 조기 폐차 고객 대상 최대 1천만 원 할인 혜택 제공	글로벌오토뉴스
한성자동차, 2025년 서비스센터 신입직원 대규모 공개채용 실시	글로벌오토뉴스
할리데이비슨 코리아 ‘2025 트라이크 오너스 라이딩 투어’ 성공적 개최	글로벌오토뉴스
BMW, 중국 시장 공략 강화… 현지 AI 기업 딥시크 탑재	글로벌오토뉴스
토요타, '중국 주도' 현지화 전략으로 전환… 전기차 시장 공략 고삐	글로벌오토뉴스
폭스바겐, '중국 맞춤형' 전략 가속… 3년 내 30종 이상 신차 쏟아낸다	글로벌오토뉴스
캐나다, 미국산 보이콧 확산 속, 최대 22% 인상에 수요 '급감' 우려	글로벌오토뉴스
영국, 미국 자동차 관세 인하 검토…자국 수출품 보호 위한 협상 카드	글로벌오토뉴스
미국, 외국 건조 자동차 운반선에 입항료 부과 계획	글로벌오토뉴스
브랜드를 이끄는 리더, 메르세데스-AMG E 53 하이브리드 4MATIC+ 에디션 1 시승기	글로벌오토뉴스
디지털 격차가 문턱 되는 실손보험…국회, 포용적 청구 시스템 논의	뉴스탭
아페쎄 골프, 반얀트리 서울서 한달간 팝업스토어 진행…고진영·김민선7 애착템도 공개	뉴스탭
천호몰, 4월 30일 ‘가족愛 담은 특별 LIVE’로 라이브커머스 론칭... 990원 특가딜로 고객 공략	뉴스탭
제주신화월드, 미쉐린 1스타 중식당 '용푸' 국내 첫 오픈	뉴스탭
딥브레인AI 'AI 스튜디오', G2 선정 '2025 베스트 AI 소프트웨어' TOP 50 올라	뉴스탭
차량용 디스플레이, OLED·Mini-LED 채택 가속…2025년 2억 4,180만 대 돌파 전망	뉴스탭
중고차 감가율 좌우하는 선택 옵션, 선루프가 '1순위'	뉴스탭
황금연휴 타고 확산되는 ‘룸꾸’ 트렌드…호텔업계, 캐릭터 테마룸으로 가족 공략	뉴스탭
다나와, ‘배틀그라운드 대학최강자전’ 공식 후원…총상금 1,200만원 규모 e스포츠 협업 본격화	뉴스탭
디펜딩 챔피언 이정민, 부상으로 KLPGA 챔피언십 출전 취소	연합뉴스
'따라할 수 없는 독특한 스타일' 시트로엥, C5 에어크로스 티저 공개	오토헤럴드
[EV 트랜드] 테슬라, 뉴욕 직판 매장 폐쇄 위기... 프랜차이즈법 갈등 격화	오토헤럴드
르노, 신형 콤팩트 SUV '보레알' 출시 예고... 전 세계 70개국 출시 예정	오토헤럴드
연평균 121대, 기아 서상배 오토컨설턴트 ‘그랜드 마스터’ 등극... 누적 4001대	오토헤럴드
글로벌 인재 채용 플랫폼 '기아 탤런트 라운지' 오픈, 차별화된 콘텐츠 제공	오토헤럴드
감가율 낮추는 핵심 비결... 이 옵션 하나로 최대 2%, 중고찻값 확 달라진다	오토헤럴드
기아 EV4가 더 특별해진 비결... 하만카돈 프리미엄 카오디오 사운드 시스템	오토헤럴드
'축구장 20개 규모' BYD, 세계 최대 자동차 운송선 브라질로 첫 항해	오토헤럴드
페라리 12칠린드리ㆍ12칠린드리 스파이더, iF 디자인 '골드 어워드' 수상	오토헤럴드
만트럭, 노후 경유 트럭 폐차하고 신차 구입 대상 할인 혜택 제공	오토헤럴드
[EV 트렌드] '관세 전쟁 여파' 볼보 EX30, 벨기에 공장서 조기 생산 돌입	오토헤럴드
현대차, ACT 엑스포 2025 참가 '더 뉴 엑시언트 수소전기트럭' 최초 공개	오토헤럴드
기아, 영국서 'PV5' 전격 공개... 유럽 상용차 시장 진출 교두보 구축	오토헤럴드
'296 GTB 스페셜 버전' 800마력 PHEV, 페라리 296 스페치알레 공개	오토헤럴드
시트로엥, 순수 전기 SUV 'C5 에어크로스' 공개... 13인치 대형 스크린 탑재	오토헤럴드
GM 한국사업장, 사내 장애인 운영 베이커리 오픈 2주년...지역사회 기여 재다짐	오토헤럴드
제네시스ㆍ테이트 모던 '더 제네시스 익스비션: 서도호: Walk the House'	오토헤럴드
로터스, 엘레트라 등 럭셔리 EV 전략 적중...지난해 글로벌 인도대수 74% 증가	오토헤럴드
차량 구매부터 유지관리 '모두 하나로' JLR코리아 원(One) 전략 공개	오토헤럴드
현대차·기아, 2024 CDP 코리아 어워드 '기후변화 대응ㆍ수자원 관리 부문 '수상	오토헤럴드
슬레이트 CEO, 전기차 시대에 "대형 스크린과 자율주행은 잊어라"	오토헤럴드
CJ그룹, '더CJ컵'서 세계 골프팬에 K컬쳐 알린다	연합뉴스
트럼프 일가, 카타르에 호화판 골프장 짓기로…이해충돌 논란	연합뉴스
박세리 '맨발 투혼'…세계 여자 골프 역사의 중요 사건 4위	연합뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

2+3=X를 위해 13번 고민하는 AI... 텐센트, AI 모델의 '오버씽킹' 현상 분석

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

2+3=X를 위해 13번 고민하는 AI... 텐센트, AI 모델의 '오버씽킹' 현상 분석

공유하기

공감/비공감