비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

알리바바, 추론 능력 강화한 대규모 언어모델 '마르코-o1' 공개

2024.12.11. 12:18:34
조회 수
296
4

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

알리바바(Alibaba)는 기존 문제 해결과 개방형 문제 해결이 모두 가능한 대규모 언어모델(LLM) '마르코-o1(Marco-o1)'을 발표했다.

알리바바의 마르코폴로(MarcoPolo) 팀이 개발한 마르코-o1은 수학, 물리학, 코딩을 비롯해 명확한 기준이 없는 분야에서도 복잡한 추론이 가능한 AI 모델이다. 오픈AI(OpenAI)의 o1 모델의 추론 발전을 기반으로, 사고 연결(Chain-of-Thought) 미세조정, 몬테카를로 트리 탐색(Monte Carlo Tree Search), 새로운 반영 메커니즘을 도입했다.

개발팀은 오픈-O1 CoT 데이터셋, 마르코-o1 CoT 데이터셋, 마르코 명령어 데이터셋 등 6만 개 이상의 엄선된 데이터를 활용해 포괄적인 미세조정 전략을 구현했다. 영어 MGSM 데이터셋에서 6.17%, 중국어 데이터셋에서 5.60%의 정확도 향상을 달성했으며, 특히 구어적 표현과 문화적 뉘앙스 번역에서 우수한 성능을 보였다.

마르코-o1의 가장 혁신적인 특징은 몬테카를로 트리 탐색 프레임워크 내에서 다양한 행동 단위를 구현한 것이다. 32토큰이나 64토큰 단위의 세부 단계까지 추론 경로를 탐색할 수 있다. 또한 자체 평가와 추론 재검토가 가능한 반영 메커니즘을 도입해 복잡한 문제 해결의 정확도를 높였다.

알리바바 개발팀은 현재 모델의 한계도 인정했다. 강력한 추론 특성을 보여주지만, 완전한 'o1' 모델에는 미치지 못한다고 밝혔다. 향후 결과 보상 모델링(Outcome Reward Modeling)과 과정 보상 모델링(Process Reward Modeling)을 도입하고, 강화학습 기술을 통해 문제 해결 능력을 더욱 발전시킬 계획이다.

마르코-o1 모델과 관련 데이터셋은 알리바바의 깃허브(GitHub) 저장소를 통해 연구 커뮤니티에 공개됐으며, 설치 지침과 FastAPI를 통한 배포 예제 스크립트도 함께 제공된다.

해당 기사에서 언급한 모델에 대한 자세한 내용 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
현대차그룹, 교육 사각지대 해소 '대학생 교육봉사단 H-점프스쿨' 12기 수료식 오토헤럴드
현대차그룹, ‘월드 하이드로젠 엑스포 2025’ 참가...글로벌 수소 생태계 확장 오토헤럴드
미국 트럼프, CAFE 연비 규제 대폭 완화... 자동차 산업 전기차 전환에 제동 글로벌오토뉴스
현대차그룹, ‘H-점프스쿨’ 12기 수료식 개최 글로벌오토뉴스
한국자동차환경협회·글로벌경영지원협력협회 MOU 체결 글로벌오토뉴스
WHE 2025 개막… 국내 최대 규모의 글로벌 수소 비즈니스 플랫폼 출범 글로벌오토뉴스
기아, 화성 오토랜드에 50MW급 태양광 구축 글로벌오토뉴스
다시 게이머들의 성지로. 연이은 게임 행사 개최로 주목받는 킨텍스 게임동아
“니케 홍련과 온천욕을?” 게임사들이 선보이는 힐링되는 ASMR! 게임동아
AGF 2025 NHN 부스, ‘어비스디아’, ‘최애의 아이 퍼즐 스타’ 부스 콘텐츠로 이용자 마음 공략한다 게임동아
[프리뷰] 사전 예약 7일만에 50만 명 돌파, '포트리스3 블루' 어떻게 나오길래 게임동아
“겨울 느낌 가득”... ‘승리의 여신: 니케’, 신규 SSR 니케 2종 등 대규모 업데이트 단행! 게임동아
라이엇 게임즈, 2026 발로란트 챔피언스 투어 변경점 발표 게임동아
“룬테라 세계관 기반” 라이엇 게임즈 TFT, 올해 마지막 신규 세트 ‘신화와 전설’ 출시 게임동아
젬블로컴퍼니, 니케와 이터널 리턴 '니벨아레나'로 AGF2025 참가 게임동아
“우리만 방송합니다~” 디즈니+ ‘2025 LoL KeSPA CUP’ 글로벌 독점 생중계한다 게임동아
스마일게이트 ‘카제나’ 신규 캐릭터 ‘치즈루’ 등 업데이트... “레벨업에 필요한 재화도 80% 정도 줄였다” 게임동아
[타임리스 모빌리티] '로열엔필드 불렛' 100년을 이어온 모터사이클의 전설 오토헤럴드
"이래서 안 팔리나" 랜드로버 주행거리 20만km 이상 68.5%... 압도적 1위 오토헤럴드
기아 PV5 카고, 英 2026 왓 밴 어워즈 ‘올해의 밴’ '올해의 콤팩트 밴' 2관왕 오토헤럴드
이 시간 HOT 댓글!
1/4