알리바바, 추론 능력 강화한 대규모 언어모델 '마르코-o1' 공개 : 다나와 DPG는 내맘을 디피지

알리바바(Alibaba)는 기존 문제 해결과 개방형 문제 해결이 모두 가능한 대규모 언어모델(LLM) '마르코-o1(Marco-o1)'을 발표했다.

알리바바의 마르코폴로(MarcoPolo) 팀이 개발한 마르코-o1은 수학, 물리학, 코딩을 비롯해 명확한 기준이 없는 분야에서도 복잡한 추론이 가능한 AI 모델이다. 오픈AI(OpenAI)의 o1 모델의 추론 발전을 기반으로, 사고 연결(Chain-of-Thought) 미세조정, 몬테카를로 트리 탐색(Monte Carlo Tree Search), 새로운 반영 메커니즘을 도입했다.

개발팀은 오픈-O1 CoT 데이터셋, 마르코-o1 CoT 데이터셋, 마르코 명령어 데이터셋 등 6만 개 이상의 엄선된 데이터를 활용해 포괄적인 미세조정 전략을 구현했다. 영어 MGSM 데이터셋에서 6.17%, 중국어 데이터셋에서 5.60%의 정확도 향상을 달성했으며, 특히 구어적 표현과 문화적 뉘앙스 번역에서 우수한 성능을 보였다.

마르코-o1의 가장 혁신적인 특징은 몬테카를로 트리 탐색 프레임워크 내에서 다양한 행동 단위를 구현한 것이다. 32토큰이나 64토큰 단위의 세부 단계까지 추론 경로를 탐색할 수 있다. 또한 자체 평가와 추론 재검토가 가능한 반영 메커니즘을 도입해 복잡한 문제 해결의 정확도를 높였다.

알리바바 개발팀은 현재 모델의 한계도 인정했다. 강력한 추론 특성을 보여주지만, 완전한 'o1' 모델에는 미치지 못한다고 밝혔다. 향후 결과 보상 모델링(Outcome Reward Modeling)과 과정 보상 모델링(Process Reward Modeling)을 도입하고, 강화학습 기술을 통해 문제 해결 능력을 더욱 발전시킬 계획이다.

마르코-o1 모델과 관련 데이터셋은 알리바바의 깃허브(GitHub) 저장소를 통해 연구 커뮤니티에 공개됐으며, 설치 지침과 FastAPI를 통한 배포 예제 스크립트도 함께 제공된다.

해당 기사에서 언급한 모델에 대한 자세한 내용 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

호이, PGA 투어 배러쿠다 챔피언십 2R 단독 선두	연합뉴스
국내 야간 영업 골프장 238곳…4년 전 대비 72개소 증가	연합뉴스
미세하게 움직인 공…라우리, 디오픈서 통한의 '2벌타'	연합뉴스
임성재, 디오픈 2R 공동 34위…한국 선수 유일하게 생존	연합뉴스
'아이디어를 시제품제작과 현실 창업으로'··· 서울과기대 학생창업 여정 취재기	IT동아
업스테이지 솔라 프로2 써보니··· '독보적인 OCR 인식률· API 확장성 인상적'	IT동아
UAE, 엔비디아 AI 칩 구매 계약 보류… 美 "중국 유출 우려"	AI matters
스레드에 AI 기능 도입되나… 메타, 생성형 AI 제품 부사장 ‘스레드 총괄 책임자’로 임명	AI matters
“실감형 미디어 콘텐츠 자동 생성”… 네이버, AI-XR 결합한 '비전 테크 트라이앵글' 공개	AI matters
“사용자 공지 없었다” 앤트로픽, 클로드 코드 사용량 제한 강화 및 변경 논란	AI matters
“명령 한 번에 여러 파일 동시 수정” 구글, 제미나이 코드 어시스트 ‘AI 에이전트’ 모드 출시	AI matters
과기정통부, AI 휴머노이드 핵심기술 개발에 5년간 216억 원 투입한다	AI matters
“사자 포효 소리부터 자연 환경음까지”... 어도비, AI 효과음 제작하는 신기능 베타 출시	AI matters
넷플릭스, 오리지널 드라마에 생성형 AI 최초 활용… “건물 무너지는 장면 구현”	AI matters
MSI코리아, 20일 'MSI RTX 50 시리즈 AI 노트북 팝업스토어' 운영	다나와
MSI '2025 상반기 다나와 히트브랜드 팝업 행사' 참가	다나와
트럼프 대통령, “AI·에너지 인프라에 900억 달러 투자”…미국 산업 재건 본격화 (1)	다나와
KPGA 김태우, 챌린지 투어 첫 우승	연합뉴스
현대차, 차량 내비게이션에 '구글 플레이스' 통합…고객 편의성 대폭 강화	글로벌오토뉴스
테슬라 로보택시, 법적 책임 논란 가열…사고시 책임 소재 문제 본격 점화 (1)	글로벌오토뉴스
우버, 루시드에 3억 달러 투자… 자율주행 로보택시 시장 본격 진입 (1)	글로벌오토뉴스
미 상무부, 중국산 EV용 흑연에 93.5% 반덤핑 관세 부과	글로벌오토뉴스
TIER IV, 일본 전역에 레벨4+ 자율주행 도입 예고	글로벌오토뉴스
영국, 10년간 35억 파운드 투입 ‘DRIVE35’ 프로그램 발표	글로벌오토뉴스
볼보 XC60, 미국 리지빌 공장서 2026년 말부터 본격 생산	글로벌오토뉴스
“혁신 없는 휠베이스 연장?” 테슬라 모델 Y L, 中 시장서 통할까	글로벌오토뉴스
전기차 스타트업 스카우트, 美 자동차 판매법에 ‘정면 도전’	글로벌오토뉴스
국가대표 유민혁, 신한동해 아마추어 골프대회 2년 연속 우승	연합뉴스
슈퍼센트 변지훈 이사, '베트남 게임 커넥트'에서 퍼블리싱 전략 공개	게임동아
스테이블코인으로 달아오르는 웹3, 신작 열기도 뜨겁다	게임동아
인왕3 α 체험판, 7월 30일까지 기간 한정 배포 (1)	게임동아
롬: 골든 에이지, 8월 12일 글로벌 서비스 돌입	게임동아
‘카오스 제로 나이트메어’, ‘홀로라이브’ 신규 OST 공개	게임동아
도봉구 창동문화체육센터에 스크린파크골프장 문연다	연합뉴스
6시간 걸린 디오픈 1R…느린 경기 진행에 지친 선수들	연합뉴스
볼보자동차, 美 고율 관세에 휘청...2분기 영업손실 1조 4000억 적자	오토헤럴드
자동차 웹사이트 만족도, 기본 못 지키면 점수 ‘뚝’… 벤츠·GMC 최고	오토헤럴드
상반기 전기차 판매 910만대 돌파…中 주도, 獨 반등, 美 불확실성 속 정체	오토헤럴드
또 추가, 올해만 88건… ‘리콜 왕’ 포드, 반년 만에 최다 리콜 신기록	오토헤럴드
연식과 무관 'BMW·MINI 모든 순수전기차 무상 안전점검' 캠페인 실시	오토헤럴드
포르쉐 마칸, 글로벌 누적 생산 100만 대 돌파… 911보다 4배 빠른 기록	오토헤럴드
[EV 트렌드] 테슬라 ‘모델 3+’ 中 출시 임박…LG 배터리로 주행거리 UP	오토헤럴드
니오, 배터리 평생 보증 · 무제한 교체 중단…악용 사례 급증 정책 철회	오토헤럴드
수출 130% 급증한 BYD, 7번째 전기차 전용선 띄웠다	글로벌오토뉴스
2026 F1 드라이버 이적 시장 분석, "정해진 것은 아무것도 없다"	글로벌오토뉴스
중국, 배터리 핵심 기술 수출 통제 강화…LFP 등 양극재 제조 기술 허가 필수	글로벌오토뉴스
파나소닉, 미 캔자스 두 번째 배터리 공장 준공…생산 목표 시점 연기	글로벌오토뉴스
BYD, 전 차종 '스마트폰-차량 연결' 공식 출시…화웨이·샤오미 등 주요 브랜드 지원	글로벌오토뉴스
중국 승용차 수출 시장 다변화…멕시코·UAE 강세, 러시아는 급감	글로벌오토뉴스
미 전기차 판매 5분기 만에 하락세…테슬라 부진 겹쳐 확산 지연 우려	글로벌오토뉴스
중국 PHEV 시장 경쟁 격화…지리, 유럽 기술 통합해 BYD 추격	글로벌오토뉴스
FAW-알리바바, 자동차 AI 연구소 공동 설립…‘도메인별 대규모 언어 모델’ 개발 착수	글로벌오토뉴스
베드락 로보틱스, 8,000만 달러 투자 유치…건설 중장비 24시간 자율 운영 시대 연다	글로벌오토뉴스
‘한성자동차’ 조선 팰리스와의 파트너십 본격 전개	글로벌오토뉴스
BMW 그룹 코리아, ‘BMW·MINI 전기차 무상 안전점검 캠페인’ 실시	글로벌오토뉴스
메르세데스-벤츠 코리아, 여름철 쾌적한 차량 운전 돕는 ‘2025 여름맞이 캠페인’ 실시	글로벌오토뉴스
바스프 자동차 코팅 솔루션, 지속가능한 투톤 도장 기술로 ‘혁신 공정상‘ 수상	글로벌오토뉴스
한국타이어, 포르쉐 순수 전기 SUV ‘마칸(Macan)’에 신차용 타이어 공급	글로벌오토뉴스
피렐리, ‘2025 굿우드 페스티벌 오브 스피드’ 참가	글로벌오토뉴스
KGM, ‘익스피리언스 센터 부산’ 개관 기념 시승 모집 이벤트	글로벌오토뉴스
기아 EV4 전기동력 세단의 디자인	글로벌오토뉴스
‘메르세데스-벤츠 G 450 d MANUFAKTUR HS효성에디션’ 출시	글로벌오토뉴스
티머니, 광복 80주년 기념 ‘태극기 티머니카드’ 출시…수익금 전액 독립유공자 지원에 기부 (1)	뉴스탭
KFC, 복날 맞이 ‘치킨복켓’ 프로모션 실시… 최대 39% 할인 혜택	뉴스탭
네오위즈 '디제이맥스 리스펙트 V', '디제이맥스 미라클 2025' 공연 개최	게임동아
에픽게임즈 스토어, 여름 세일 모드 돌입...문명 6: 플래티넘 에디션 무료 제공 (1)	게임동아
넷플릭스x유비소프트 크로스! 어쌔신 크리드 실사 드라마화 된다 (1)	게임동아
2K, 'NBA 2K26' 커버 모델에 샤이 길저스 알렉산더...9월 5일 전 세계 출시	게임동아
컴투스 신작 ‘도원암귀 크림슨 인페르노’, 애니메이션 방영 시기 맞춰 브랜드 페이지 공개	게임동아
한빛소프트, PC 그라나도 에스파다, 여름 이벤트 개최	게임동아
카이아, 테더, 카카오페이, 라인 넥스트 ‘대한민국 스테이블코인 해커톤’ 공동 개최	게임동아
웹젠 뮤오리진3, 신규 성장 콘텐츠 '투혼' 선봬	게임동아
라인게임즈, 아티스트 레이블 NOMORE와 MOU 체결	게임동아
넷마블 엠엔비 '쿵야 레스토랑즈', 뉴트리코어 협업 제품 출시 (1)	게임동아
마틴, PGA 투어 배러쿠다 챔피언십 1R 단독 선두	연합뉴스
넥써쓰, 크로쓰x '모두의 빙고' 온보딩	게임동아
'주사위의 신’, 여름 맞이 신규 맵 ‘워터 스플래시’ 업데이트	게임동아
‘테일즈위버’, 여름 대규모 개편 업데이트 ‘NEW WAVE’ 실시	게임동아
넷마블 '제2의 나라', 신규 레이드 '마녀의 성 지하' 등 업데이트 실시	게임동아
‘마영전’, 시즌4 에피소드12 업데이트	게임동아
자동차 디자인과 성능 두 마리 토끼 잡는 ‘샤이테크’	IT동아
디오픈 첫날 1언더파 매킬로이 "온 나라가 응원해주는 느낌"	연합뉴스
김주형, 디오픈 첫날 선두에 2타차 공동 10위	연합뉴스
[오늘의 스팀] 1편에 이은 스트롱홀드 새 결정판 호평 (1)	게임메카
게임 플레이어 성향 자동으로 알아내는 AI 기술 등장... 게임 난이도 개인화 기대돼	AI matters
챗GPT, 알고 보니 ‘서구 문화’만 편애한다… "일본 문화는 모든 AI가 이해 포기"	AI matters
“진단 애매할 때 써보세요” 5세 이하 소아 폐렴 확인해 주는 AI 웹사이트 등장	AI matters
[Q&AI] 이재용 무죄 확정… 삼성 주가 영향은?	AI matters
당뇨 환자도 안심하고 먹을 수 있게... 스위스가 만든 똑똑한 AI 영양사	AI matters
2025년 상반기만 기술 업계서 2만 명 이상 감원… “AI 전환 가속이 주 원인” (1)	AI matters
오픈AI·앤트로픽 연구진 “xAI, AI 안전 기준 심각하게 위반했다”	AI matters
“연애 가능한 AI 캐릭터 만든다”… xAI, '와이푸' 전담 엔지니어 채용 시작	AI matters
메타 인수된 스케일 AI, 직원 14% 대규모 해고... 데이터 라벨링 사업 축소	AI matters
KT, 도서산간 지역 청소년들을 위한 이동식 AI 체험관 'AI 스테이션' 운영 개시 (1)	AI matters
“AI가 대신 전화 걸어준다” 구글, 검색에 제미나이 2.5 Pro 도입	AI matters
메타, 오픈AI 핵심 연구원 두 명 또 추가 영입… 초지능 연구팀 합류	AI matters
네이버, MIT와 휴머노이드 개발… 韓 로봇 생태계 도약 신호탄 될까	AI matters
챗GPT 끝났나? 신규 사용자 비율 2개월 연속 하락, 제미나이는 상승세 지속"	AI matters
그록의 ‘AI 친구’, 성적 대화하고 학교 테러 부추겨 논란	AI matters
우기정 대구 컨트리클럽 회장, 제27대 연세체육회 회장에 선임	연합뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

알리바바, 추론 능력 강화한 대규모 언어모델 '마르코-o1' 공개

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

알리바바, 추론 능력 강화한 대규모 언어모델 '마르코-o1' 공개

공유하기

공감/비공감