바이트댄스, 트릴리언급 모델을 47% 빠르게 만드는 ‘코멧’ 기술 공개 : 다나와 DPG는 내맘을 디피지

Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts

1조 규모 AI 모델의 숨은 병목: 디바이스 간 통신이 실행 시간의 47%를 차지

아주 큰 규모의 인공지능(AI) 모델을 운용할 때, 모델 내부에서 발생하는 ‘통신’이 생각보다 많은 시간을 차지해 전체 속도를 저하시킨다는 문제가 있어 왔다. 바이트댄스(ByteDance) 씨드(Seed) 연구팀은 이러한 문제를 해결하기 위해 코멧(Comet)이라는 새로운 기술을 개발했으며, 이를 통해 평균 최대 1.96배 더 빠른 실행이 가능하다고 밝혔다.

인공지능 모델의 규모가 매우 커지면 여러 대의 GPU(그래픽 처리 장치)를 사용해야 하고, 이 때 서로 다른 GPU 사이에 데이터를 주고받는 통신 과정이 필수적으로 발생한다. 특히 혼합 전문가 모델(Mixture-of-Experts, MoE)은 ‘전문가’라는 모듈을 여러 개 두어, 각 입력 데이터에 맞춰 필요한 것만 활성화한다. 이렇게 하면 모델 전체 파라미터(학습에 필요한 숫자)는 매우 많더라도 실제로는 일부만 계산하므로 효율적이다.

그러나 전문가 모듈이 여러 GPU에 분산되어 있으면, 이들 GPU 간 통신이 빈번히 일어난다. 실제로 널리 쓰이는 MoE 모델에서는 통신이 전체 실행 시간의 최대 47%를 차지할 정도로 크게 나타난다고 한다.

청크 단위 처리의 함정: GPU 계산 효율성 저하를 극복한 코멧의 미세 단위 중첩 기술

그동안은 통신과 계산을 중첩하기 위해 입력 데이터를 청크(chunk)로 나누어, 한쪽에서는 계산을, 다른 한쪽에서는 통신을 병렬로 수행하는 파이프라인 방식을 시도해 왔다. 그러나 청크를 잘게 쪼개면 전문가들이 나눠진 데이터를 처리하게 되면서 GPU가 낼 수 있는 최대 계산 성능을 충분히 발휘하기 어려워진다. 또한 MoE는 입력이 유동적으로 변하기 때문에 통신량과 계산량이 항상 동일한 비율로 나뉘지는 않으며, 그 결과 균형 잡힌 중첩이 쉽지 않다.

코멧은 이 문제를 극복하기 위해 훨씬 미세한 단위에서 통신과 계산을 겹치도록 새로 설계한 시스템이다. 통신과 계산이 서로 얽혀 있는 복잡한 의존성을 해결하고, GPU 리소스를 유연하게 배분해 미세 단위 중첩을 실현한다.

텐서 분해와 데이터 의존성 해결

코멧은 텐서(모델이 주고받는 다차원 배열)를 특정 축(차원)에 따라 잘게 나누고, 이 데이터를 처리하는 순서를 재구성함으로써 통신과 계산이 동시에 일어나는 데 필요한 구조를 만든다. 이러한 방법으로, 기존에는 “계산을 시작하기 전 통신이 끝나야 한다”와 같은 복잡한 제약이 사라지고, 통신과 계산 사이의 미세 단위 중첩이 가능해진다.

이를 위해 공유되는 텐서에 대한 의존성 관계를 분석해, 특정 차원을 따라 텐서를 분해하고 연산 순서를 재배치하는 두 가지 과정을 거친다. 이를 통해 세분화된 데이터 의존성을 깨뜨리고, 효율적으로 통신과 계산을 재스케줄링해 더욱 자유로운 실행 순서를 확보한다.

GPU 스레드 블록 배분의 최적화: 통신과 계산 워크로드를 실시간으로 조율하는 적응형 기술

코멧은 이렇게 단위가 잘게 쪼개진 통신과 계산 작업에 대해 GPU의 스레드 블록을 동적으로 배분한다. 예컨대 통신이 집중적으로 필요한 순간에는 통신에 더 많은 스레드 블록을 배정하고, 계산이 주가 될 때는 계산 쪽에 배정해 통신이 계산을 가로막지 않도록 한다.

이러한 적응형 워크로드 할당 기법은 각 시점에서 통신과 계산이 균형을 유지하도록 하며, 이를 통해 지연 시간을 줄이고 전체 실행 성능을 높인다. 코멧은 스레드 블록을 지능적으로 재분배함으로써 통신이 계산 성능에 미치는 영향을 줄이고, 높은 GPU 활용 효율을 유지한다.

1.96배 빨라진 MoE 레이어: 수만 대 GPU 클러스터에서 검증된 코멧의 실전 성능

바이트댄스 연구팀이 NVIDIA H800과 L20 등 최신 GPU 클러스터에서 코멧을 적용해 본 결과, 일반적인 MoE 레이어에서 이전 대비 약 1.96배의 속도 향상을 달성했다고 한다. 또한 모델 전체를 동작시켰을 때, 예를 들어 Mixtral-8x7B, Qwen2-MoE, Phi3.5-MoE 같은 모델들은 평균 1.71배 더 높은 속도를 보였다고 한다.

더 나아가 이 기술은 이미 만 대 이상의 GPU를 사용하는 실제 프로덕션 환경에도 적용되어, 수백만 시간에 달하는 GPU 계산 시간을 절약했다고 한다. 이는 대규모 모델을 훈련하거나 추론하는 데 필요한 막대한 비용과 시간을 줄이는 데 매우 큰 도움이 된다.

수백만 GPU 시간 절약의 혁신: 트릴리언급 AI 모델 개발 비용을 획기적으로 낮추는 코멧 기술

코멧 기술이 공개됨에 따라, 트라이턴(Triton)이나 TVM 같은 컴파일러와 결합하거나 추가 최적화를 진행하는 등 새로운 발전 가능성도 열리고 있다. 통신-계산을 미세 단위로 중첩하는 이 기법은 앞으로 트릴리언 단위의 파라미터를 갖춘 초거대 AI 모델을 훨씬 빠르고 경제적으로 운용하게 해 줄 것으로 기대된다. 결국 코멧은 대규모 AI 모델에서 통신 오버헤드를 줄이기 위해 통신과 계산을 미세 단위로 교차 중첩시키는 혁신적인 방식이다. 이를 통해 최대 1.96배까지 모델을 가속할 수 있고, 그 결과 대규모 모델 개발 비용과 시간을 대폭 절감하는 효과가 있다.

FAQ

Q: 혼합 전문가 모델(MoE)이란 무엇이며 왜 중요한가요?

A: 혼합 전문가 모델은 모든 매개변수를 활성화하지 않고 각 입력에 대해 일부 전문가만 활성화하는 희소 구조를 도입한 모델입니다. 이 방식은 계산 비용을 크게 늘리지 않으면서도 모델 크기를 수조 개 매개변수까지 확장할 수 있게 해주어, AI 모델의 성능 향상에 중요한 역할을 합니다.

Q: 코멧(Comet)은 어떻게 기존 MoE 시스템의 성능을 향상시키나요?

A: 코멧은 통신과 계산 작업 간의 미세 단위 중첩을 가능하게 하는 두 가지 핵심 기술을 도입했습니다. 첫째, 데이터 의존성 해결 방법을 통해 복잡한 의존성을 분석하고 최적화된 파이프라인을 구축합니다. 둘째, 적응형 워크로드 할당 방법으로 GPU 자원을 통신과 계산 작업에 동적으로 배분하여 최적의 성능을 이끌어냅니다.

Q: 코멧의 연구 결과가 실제 AI 개발에 어떤 영향을 미칠까요?

A: 코멧의 기술은 이미 실제 프로덕션 환경에 적용되어 수백만 GPU 시간을 절약하고 있습니다. 이는 대규모 AI 모델 개발 비용과 시간을 크게 줄이며, 더 효율적인 AI 모델 개발을 가능하게 합니다. 또한 이 연구는 미세 단위 계산-통신 최적화 분야에 새로운 접근법을 제시하여 향후 AI 시스템 개발에 중요한 기반이 될 것입니다.

해당 기사에서 인용한 논문 원문은 링크에서 확인할 수 있다.

이미지 출처: 바이트댄스

기사는 클로드와 챗GPT를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

골프존그룹, 창립 25주년 사회공헌 활동 '스윙 유어 드림' 개최	연합뉴스
'수원CC는 내 땅' 7언더파 이예원, 타이틀 방어 '파란불'	연합뉴스
레저산업연구소, 레저백서 2025 발간…골프 산업 전망 등 수록	연합뉴스
SK텔레콤 채리티오픈 14일 개최…최경주·이경규·이대호 참가	연합뉴스
브리지스톤 골프, 연철 단조 아이언 242CB+ 출시	연합뉴스
뷰소닉, 홈앤빔 구매자 대상 후기 프로모션 진행	다나와
단종됐던 볼보 간판급 왜건 XC70, 플러그인 하이브리드 SUV로 부활	오토헤럴드
폴스타코리아, 국내 최대 규모 ‘스페이스 수원’ 오픈…고객 접점 확대 속도	오토헤럴드
기아, 인도 전략형 3열 미니밴 '카렌스 클라비스' 완전 공개	오토헤럴드
'불안정한 대외 환경 속에도' 람보르기니 1분기 판매 역대 최고	오토헤럴드
폴스타, '2025 브랜드 고객충성도 대상' 전기차 부문 3년 연속 1위 수상	오토헤럴드
마세라티, 그란투리스모 · 그란카브리오 엔트리 출시 '프리마 에디치오네' 한정 제공	오토헤럴드
'세련된 컬러감으로 다시' 쉐보레, 2026년형 트레일블레이저 출시	오토헤럴드
기아 오토랜드 광주의 첫 전용 전기차 EV5… 글로벌 판매로 기대감 고조	오토헤럴드
트럼프 관세 위협에 미국산 부품 비중 50% 넘어야… 자동차 업계 '촉각'	글로벌오토뉴스
솔라엣지, 상업용 태양광 연동 스마트 EV 충전기로 친환경·저비용 충전 혁신	글로벌오토뉴스
람보르기니, 2025년 1분기 판매 2,967대, 매출 10억 달러 돌파	글로벌오토뉴스
중국 자동차 시장, 정부 정책 및 모터쇼 효과로 3월 판매 급증	글로벌오토뉴스
미쓰비시 자동차, 혼하이·닛산으로부터 전기차 OEM 공급… 일본 시장 및 EV 전략 강화	글로벌오토뉴스
중국 자동차 시장 판도 변화: 폭스바겐 밀리고 BYD 질주	글로벌오토뉴스
GM, 3D 프린팅 기술로 '셀레스틱' 대량 생산	글로벌오토뉴스
유럽 자동차 시장, 지정학적 불안과 경제 침체 속에서도 회복 조짐	글로벌오토뉴스
페라리, 2026년 10월 첫 전기차 인도…1분기 호실적에도 연간 전망 유지	글로벌오토뉴스
BMW, 미국 관세 7월 인하 기대…무역 불확실성 속 2025년 전망 유지	글로벌오토뉴스
미쓰비시, 닛산 리프 기반 차세대 전기차 내년 북미 출시	글로벌오토뉴스
BMW 코리아, 창립 30주년 기념 5월 온라인 한정 에디션 5종 출시	글로벌오토뉴스
콘티넨탈, ‘2025 서울자전거대행진’ 공식 협찬사 참가	글로벌오토뉴스
폴스타, 3년 연속 전기차 고객충성도 1위… 소비자 신뢰 다시 입증	글로벌오토뉴스
람보르기니, 2025년 1분기 역대 최고 실적 달성	글로벌오토뉴스
현대차 아이오닉 9·기아 EV3, 2025 탑기어 전기차 어워즈 2관왕	글로벌오토뉴스
쉐보레, 2026년형 트레일블레이저 출시	글로벌오토뉴스
338. BMW의 하트 오브 조이, 그리고 “다시 중국으로”	글로벌오토뉴스
알파스캔, 올레드 480Hz 프리미엄 게이밍 모니터 '276QKD' 출시 행사 진행	다나와
농협, KLPGA 대회장에 '밥차'…"우리 쌀로 건강한 아침 식사를"	연합뉴스
기획부터 편집까지, 유튜브 콘텐츠 제작에 핵심적인 9가지 AI 툴	다나와
KPGA 클래식 2라운드 악천후로 취소…54홀 경기로 축소	연합뉴스
골프장에서 열리는 K팝 향연 '그린콘서트' 31일 개최	연합뉴스
컴투스홀딩스, 액션 MMORPG ‘아레스: 라이즈 오브 가디언즈’ 글로벌 퍼블리싱 계약 체결	게임동아
“투자자문 입회비 반환 드립니다” 솔깃한 전화ㆍ메시지 속지 마세요	IT동아
KLPGA 도전한 중국 상금왕 지유아이 "1승·미국 진출 목표"	연합뉴스
최혜진, LPGA 투어 미즈호 아메리카스오픈 1R 공동 2위	연합뉴스
김주형, PGA 머틀비치 클래식 1R 공동 88위	연합뉴스
김시우, PGA 트루이스트 챔피언십 첫날 공동 11위	연합뉴스
버디 폭격기 옥태훈, KPGA 클래식 1R 단독 1위…버디만 8개 성공	연합뉴스
2주년 맞은 스마일게이트 ‘아우터플레인’ 신규 캐릭터 및 메인 스토리 업데이트 (1)	게임동아
카카오게임즈 신작 3종으로 팍스 이스트 참가	게임동아
자연재해가 미뤄졌다! GTA6 내년으로 밀리니 더욱 흥미진진해진 GOTY 경쟁 (1)	게임동아
넷마블, 1분기 영업이익 497억 원 기록	게임동아
‘8번 출구’, ‘프레디의 피자가게2’… 마인크래프트 뒤를 이을 게임 원작 영화, 뭐가 준비 중일까?	게임동아
“일부 코스튬 한정 무료 배포!” 네오위즈 ‘브라운더스트2’와 ‘고블린 슬레이어 II’가 만났다	게임동아
5월은 넷마블의 달 '세븐나이츠 리버스'와 '왕좌의 게임: 킹스로드' 출격	게임동아
위메이드, '미르의 전설2'·'미르의 전설3'에 가정의 달 이벤트 마련	게임동아
김지수, KLPGA 드림투어 5차전 우승…통산 3승	연합뉴스
BYD, 日에 소형 전기차 신모델 투입할 것... 현지 브랜드 "엄청난 위협" (1)	오토헤럴드
일평균 31대씩 팔린 中 전기차 'BYD 아토 3' 지난달 543대 출고 (1)	오토헤럴드
탑기어 '2025 올해의 전기차' 대상 포함 3관왕을 차지한 의외의 브랜드	오토헤럴드
한국앤컴퍼니, 기업주도형 벤처캐피털 ‘한국앤컴퍼니벤처스’ 설립	글로벌오토뉴스
전기차의 그늘 속, 다시 주목받는 하이브리드…토요타가 강한 이유	글로벌오토뉴스
폴스타코리아, 국내 최대 규모 ‘스페이스 수원’ 공식 오픈	글로벌오토뉴스
현대차, 혁신의 속도만큼 중요한 것은 치밀한 전략	글로벌오토뉴스
GTA 6 두 번째 트레일러, 하루 만에 8,000만 뷰 돌파 (1)	게임메카
KLPGA 투어 E1 채리티 오픈, 총상금 10억원으로 증액	연합뉴스
한강부터 와이키키까지, 러너를 위한 여행지도	뉴스탭
코카-콜라, 맛집 셰프들과 손잡고 ‘레드리본 위크’ 개최…스페셜 메뉴 단독 공개	뉴스탭
2024년 OLED 발광재료 사용량 129톤…삼성디스플레이 주도 속 30% 급증	뉴스탭
더샘, 올리브영 오특서 ‘컨실러 쿠션 리뉴’ 28% 할인… 여름철 강력 커버 강조	뉴스탭
5월 중고차 시장, SUV·경차 중심 강보합…“가계지출 증가에도 일부 수요 유지”	뉴스탭
디월트, 워크웨어 담은 의류 브랜드 ‘디월트 헤리티지’ 공개…툴로에서 단독 판매 개시	뉴스탭
나이언틱, ‘몬스터헌터 나우’로 플레이엑스포 참가…헌터들을 위한 오프라인 축제 열린다	뉴스탭
정치서의 계절, 이재명 관련 도서 5권 ‘톱10’ 진입 (1)	뉴스탭
배틀그라운드 모바일, ‘스팀펑크 테마 모드’ 업데이트…기차 타고 전장 누빈다	뉴스탭
여의도 봄꽃축제, IoT 인원관제로 안전 확보…엘핀 기술 주목	뉴스탭
사전 예약 70만 돌파… ‘문명: 연맹의 시대’, 이순신 효과로 한국 유저 사로잡다	뉴스탭
폭스바겐코리아, 장마철 앞두고 서비스 패키지 구매 고객에 ‘와이퍼·워셔액 반값’ 혜택	뉴스탭
벤틀리서울·홍익대, 디자인 협업 전시 개최… 미래 럭셔리 모빌리티 상상 담았다	뉴스탭
카시오, 전자계산기 60주년 기념 일본 전통 문양 모델 출시	뉴스탭
‘롬', 500명 참가한 1차 공식 공성전 마무리	게임동아
그라비티, 중남미 ‘라그나로크 오케스트라 콘서트’ 티켓 완판!	게임동아
쉐보레 '캡티바' 부활, EV 버전으로 중남미 · 아프리카 등에 출시 계획	오토헤럴드
'중국판 아이오닉' 북경현대, 700km 달리는 전용 전기차 일렉시오 공개	오토헤럴드
"비유럽권 시장 확대 전환점" 르노코리아, 그랑 콜레오스 중남미 수출 개시	오토헤럴드
5월 가정의 달, 패밀리 SUV '팰리세이드ㆍXC90' 중고차 시세 상승 주도	오토헤럴드
'전기 부품 밀봉 불량' 현대차, 美 팰리세이드 차주에게 야외 주차 권고	오토헤럴드
포드 추격하는 BYD, 순위 급상승... 4월 수입차 판매 전월 대비 14.8% 감소	오토헤럴드
KGM, 호주 AFL 명문 콜링우드 구단 스폰서십 체결... 현지 시장 경쟁력 강화	오토헤럴드
포드, 트럼프 경고에도 머스탱 마하-E 가격 인상 추진... '관세 충격' 현실화 (1)	오토헤럴드
폭스바겐, 여름 장마철 필수 소모품 50% 할인 서비스 패키지 특별 프로모션	오토헤럴드
폭스콘, 日 미쓰비시 전기차 위탁생산 MOU... 올해 말 공개, 내년 말 양산	오토헤럴드
마크 V 헤리티지 개러지서 '벤틀리×홍익대학교 디자인 프로젝트 기획 전시'	오토헤럴드
KLPGA, 산불 피해 지원 성금 2천만원 기부	연합뉴스
BMW, 독일 고전압 배터리 공장 건설 순항… 2025년 가동 목표	글로벌오토뉴스
트럼프발 관세 폭풍, 자동차 산업 '판' 흔든다... 생존 위한 합종연횡 불가피	글로벌오토뉴스
웨이모, 로보택시 재규어 I-PACE 두 배 증강…내년 말까지 3,500대 목표	글로벌오토뉴스
미국 시카고, 전기차 급증에 발맞춰 충전 인프라 확대 박차	글로벌오토뉴스
미국 공화당, 전기차 세액 공제 폐지 가능성 시사... 업계 '긴장'	글로벌오토뉴스
테슬라, 유럽 전기차 시장에서의 하락세 심화…영국에서도 판매 급감 (1)	글로벌오토뉴스
SK온, 전고체 배터리 수명 획기적 개선… 한양대 협력 리튬 금속 양극 기술 개발	글로벌오토뉴스
멕시코, 주 40시간 근무제 헌법 개정 추진… 제조업 인건비 상승 우려	글로벌오토뉴스
폭스바겐코리아, ‘폭스바겐 서비스 패키지 구매 특별 혜택 프로모션’ 실시	글로벌오토뉴스
KG모빌리티, 호주 AFL 명문 콜링우드와 스폰서 계약	글로벌오토뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

바이트댄스, 트릴리언급 모델을 47% 빠르게 만드는 ‘코멧’ 기술 공개

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

바이트댄스, 트릴리언급 모델을 47% 빠르게 만드는 ‘코멧’ 기술 공개

공유하기

공감/비공감