리벨리온, AI 양자화 기업 '스퀴즈비츠' 인수··· 전폭적인 AI 생태계 지원 기대 : 다나와 DPG는 내맘을 디피지

[IT동아 남시현 기자] AI 반도체 제조사 리벨리온이 AI 추론 최적화 기술기업 ‘스퀴즈비츠(SqueezeBits)’를 인수한다. 리벨리온은 AI 추론에 필요한 서버용 반도체 및 서버용 신경망 처리 장치(NPU) 양산에 돌입했으며, 스퀴즈비츠의 AI 모델 양자화 및 추론 서빙 기술, 추론 최적화 오픈소스 vLLM 생태계 지원 등 전방위적인 분야에서 2년 이상 긴밀히 협력해 왔다. 리벨리온이 스퀴즈비츠를 인수함에 따라 앞으로 리벨리온의 NPU 기반 오픈소스 생태계 지원 및 소프트웨어 역량은 한층 더 견고해질 전망이다.

박성현 리벨리온 대표는 “기술적 역량과 훌륭한 인재들이 개별 기업의 경계를 넘어 결집할 때 한국의 AI 인프라 생태계가 새로운 가능성을 만들어낸다고 믿는다”라며 “리벨리온과 스퀴즈비츠의 협력으로 하드웨어, 소프트웨어, 그리고 서버 시스템 수준의 대규모 AI 인프라를 아우르는 AI 반도체 기업으로 거듭나 전 세계 시장에서 실력을 증명하겠다”라고 밝혔다.

스퀴즈비츠, AI 모델 양자화 및 기술 기업으로 잘 알려져

스퀴즈비츠는 일반인 입장에서는 생소한 AI 기업이지만 AI 하드웨어 및 소프트웨어, 오픈소스 생태계 전문가들 사이에서는 실력 있는 기술 기업으로 통한다. 스퀴즈비츠는 2022년 김형준 대표와 서울대, 포항공대, 한국과학기술원 출신 AI 연구진과 관련 전문가들이 모여 구성됐다. 사업 영역은 AI 서비스 비용 절감을 위한 AI 모델 경량화 및 최적화 부문으로 쉽게 말해 기업의 AI 구동 속도는 높이고 운영 비용을 낮추기 위한 기술을 제공한다.

핵심 기술은 AI 연산 정밀도를 저정밀도로 변환해 모델의 크기와 메모리 사용량은 줄이면서 성능은 최대한 유지하는 모델 양자화, 특정 칩에 종속되지 않고 다양한 AI 가속기 및 온디바이스 AI를 동작 환경에 최적화하는 풀스택 최적화 기술을 제공한다. 서비스로는 서비스형 소프트웨어(SaaS) 기반으로 AI 모델 경량화를 지원하는 아울라이트, 특정 AI 가속기에 맞는 맞춤형 서빙 및 배포 환경, 시나리오 등을 찾아 LLM 효율을 극대화하는 핏츠온 칩스, 독자적인 양자화 및 최적화 기술을 담은 생성형 AI 추론 엔진 예터(Yetter) 등이 있다.

크리스 래트너 모듈라 최고경영자와 김형준 스퀴즈비츠 대표가 엔비디아 GTC 2026에서 만나 사진을 찍었다 / 출처=스퀴즈비츠

스퀴즈비츠는 지난해 네이버, 한국과학기술원과 함께 인텔의 AI 가속기에서 대형언어모델을 효율적으로 구동하도록 모델 경량화 및 추론 최적화 기술을 공동 개발한 바 있으며, 엔비디아의 스타트업 지원 프로그램인 엔비디아 인셉션에 선정돼 본사 개발팀과의 기술 협력 및 기술 검증 등도 거친 바 있다. 올해 4월에는 미국 AI 인프라 기업 모듈라와 전략적 업무협약을 체결해 글로벌 AI 추론 시장에서도 목소리를 내기 시작했다.

2025년 vLLM 밋업으로 인연··· 하드웨어·생태계 지원에 광범위한 협력

리벨리온과의 인연은 지난해 8월 개최된 국내 최초의 vLLM 코리아 밋업에서 시작됐다. vLLM은 오픈소스 기반의 LLM 추론 및 서빙 엔진으로 엔비디아 GPU를 비롯한 다양한 AI 반도체에서 LLM을 처리하기 위한 인프라 표준이다. vLLM을 이용하면 동시에 대화를 연속적으로 처리할 수 있어 인프라 비용을 크게 절감하는 것은 물론 코드 몇 줄만 변경해도 오픈AI GPT, 메타 라마 3, 딥시크 등과 호환된다.

리벨리온과 레드햇이 주최하고 파이토치 한국사용자모임과 스퀴즈비츠가 기획한 2025 vLLM 밋업 당시 / 출처=IT동아

소프트웨어 지원 측면에서는 엔비디아 쿠다 뿐만 아니라 AMD ROCm, 인텔 가우디, 리벨리온 NPU 등에서도 사용할 수 있다. 즉 리벨리온 NPU로 LLM을 효율적으로 서비스할 수 있고, vLLM으로 LLM을 다루는 글로벌 AI 기업들이 엔비디아 제품을 쓰듯 리벨리온 칩을 활용하도록 vLLM 생태계 지원에 나선 것이다. 리벨리온과 레드햇이 지난해 파이토치 한국 사용자모임을 대상으로 국내 첫 vLLM 밋업을 개최한 배경이다. 당시 밋업에서는 vLLM 생태계의 주축인 레드햇의 기술 개요 및 협력 방안, 리벨리온의 vLLM 지원 노력 등이 발표됐다. 이때 행사를 파이토치 한국사용자모임과 스퀴즈비츠가 함께 기획했었다.

두 번째 개최된 vLLM 핸즈온 워크숍, 리벨리온 NPU를 쉽게 체험할 수 있다는 점이 알려지며 수많은 개발자들이 몰렸었다 / 출처=스퀴즈비츠

아울러 국내 AI 개발자들이 리벨리온 NPU를 쉽게 써볼 수 있도록 ‘vLLM 핸즈온 워크숍’ 등의 실습 프로그램도 공동 운영했다. 현재 대다수 NPU는 클라우드 기업들이 서버를 설치하고 고객 기업들이 인스턴스를 임대하는 형태로 활용한다. NPU가 기존 엔비디아 쿠다 생태계와는 달라 새롭게 학습이 필요하고 회사의 활용 환경에서 적합할지 시험해야 한다. 일반적인 개발자 입장에서는 이런 시험과정 자체를 구성하기가 쉽지않다.NPU 기업도 개발자들이 직접 NPU를 운용할 수 있도록 지침을 제공하지만 이론과 실전 수준의 차이가 난다.

그래서 리벨리온 엔지니어들과 스퀴즈비츠가 직접 별도의 워크숍을 운용해 리벨리온 NPU에서 vLLM을 활용하고 궁금증을 해결하는 자리를 마련했던 것이다. 워크숍에는 단순히 AI 개발자 뿐만 아니라 개발 경력이 있으면서 차세대 AI 반도체에 관심이 많은 직장인 개발자들이 대거 참여했고, 이를 통해 국내 AI 생태계에 직접적으로 체험 기회를 제공할 수 있었다. vLLM 밋업은 올해 4월에도 개최됐으며, 핸즈온 워크숍 역시 여러 차례 개최됐다.

리벨리온과 스퀴즈비츠의 협업, 어떻게 도움 될까?

AI 반도체 기업과 AI 양자화 기업간의 시너지는 뚜렷하다. 쉽게 말해 하드웨어 성능을 끌어올릴 수 있는 가장 좋은 선택지다. 업계 선두주자인 엔비디아는 AI 모델 자동 압축 및 컴파일러 최적화 기술을 보유한 데시AI, 온디바이스 AI 및 엣지 디바이스용 모델 경량화 기술을 보유한 옴니ML을 인수해 엔비디아 GPU에서 AI 모델 경량화를 지원 중이다.

4비트 이하 초저정밀도 양자화 분야에서도 네덜란드의 IoT, 차량용 반도체 기업 NXP와 미국의 엣지 AI 기업 시냅틱스, 미국 브로드컴, 퀄컴 등도 국내 기업인 에너자이와 AI 모델 양자화 협력을 맺는 등 AI 반도체 기업들과 모델 양자화 기업 간의 기술 지원은 전 세계적으로 활발한 상황이다.

리벨리온의 주력 AI 가속기인 리벨 100 및 반도체 칩, 출시 당시 리벨-쿼드로 출시됐으나 현재는 ‘리벨100’으로 명칭이 변경됐다 / 출처=IT동아

리벨리온이 스퀴즈비츠를 인수한 것도 쉽게 말해 NPU 고객사가 AI 모델을 더 많이, 더 효율적으로 구동할 수 있도록 하기 위함이다. 리벨리온의 주력 반도체는 AI 모델을 구축하는 학습보다는 AI 모델을 운용하는 추론 용도다. 엔비디아 칩은 학습과 추론 작업에 모두 적합하고 표준 생태계라 할 만큼 작업 효율 등도 우수하다. 하지만 단가가 비싸고 추론에 활용하기엔 전력 효율 등도 떨어진다. 그래서 AI 모델 구축은 엔비디아 GPU로 진행하고, 만들어진 AI 모델은 NPU로 추론하는 조합이 제안된다.

리벨리온은 오픈소스 프레임워크를 기반으로 소프트웨어 지원 생태계를 구축 중이며, 파이토치, 텐서플로 등 다양한 머신러닝 프레임워크에서 작성된 모델을 조율 작업 없이 바로 활용할 수 있도록 구축 중이다. 이 과정에서 스퀴즈비츠는 리벨리온 NPU를 기반으로 모델 경량화 기술 및 전용 소프트웨어를 공동 개발해 왔다. 스퀴즈비츠가 리벨리온에 합류함에 따라 앞으로 더 강력한 모델 양자화와 AI 모델 최적화 등이 기대되며, 제품 경쟁력 강화를 통해 사업성이 더욱 좋아질 전망이다.

김형준 스퀴즈비츠 대표는 “짧은 것 같으면서도 길었던 지난 여정 동안 스퀴즈비츠를 더 단단하고 빛나는 팀으로 만들어주신 팀원들, 언제나 믿고 지지해준 네이버 D2SF, 포항공과대학교 기술지주, 카카오벤처스, 삼성 넥스트, 포스코기술투자, 고객사와 파트너 분들께도 감사드린다. 앞으로 박성현 리벨리온 대표와 함께 더 큰 미션을 향해 달려가겠다”라고 말했다.

IT동아 남시현 기자 (sh@itdonga.com)

[기자 수첩] '지독한 편견' 신형 아반떼는 왜 싸구려 '토션빔'을 썼을까? (1)	오토헤럴드
현대차, AMG·포르쉐가 복제한 그 기술에 '내연기관 떨림'까지 입힌다	오토헤럴드
현대차 '기후 위기와 AI 대전환의 시대' 지속가능성을 위한 해법은?	오토헤럴드
[EV 트렌드] '자동차 공장에 들어온 AI 로봇' 바뀌는 제조업의 미래	오토헤럴드
현대차 ‘수원하이테크센터’ 로봇이 부품 나르고 데이터로 결함 잡고 (1)	오토헤럴드
리벨리온, AI 양자화 기업 '스퀴즈비츠' 인수··· 전폭적인 AI 생태계 지원 기대	IT동아
최악의 결정을 한 BMW "전기차 포기할 생각인가?" 동영상 있음	오토기어
전 세계 주가를 박살낸 애플 기습 가격 인상 총정리 동영상 있음	UnderKG
AWS 현직 전문가들이 생각하는 피지컬 AI와 AI 커리어의 미래 동영상 있음	조코딩 JoCoding
전세계 기업들을 관찰한 OpenAI 내부자가 알려주는 진짜 AX와 AI Native 되는 방법 동영상 있음	조코딩 JoCoding
연차 상관없어요. AI 시대의 인재는 OO가 전부입니다. \| AX 인재전쟁 2화 마이리얼트립 동영상 있음	조코딩 JoCoding
[BOOK] 진짜 믿고 정독해야 할 로컬 미식 바이블 (2)	트래비
오래된 시간과 새로운 감각이 공존하는 청두의 라이프스타일 스팟 5	트래비
로스앤젤레스에서 살아본 일상, LA 로컬 감성 스팟 4	트래비
도쿄의 신상 여행지 ‘타카나와 게이트웨이 시티’ 몰아보기 (1)	트래비
[숨신소] “고양이가 어질렀어요" 스팀 '매긍' 방 청소게임	게임메카
이번엔 ‘배터리·AI·웨어러블·게임 OS’가 판을 흔듭니다... 한주간 최신 IT 루머	다나와
판타지 RPG 하나가 통째로, 이환 1.2 버전 '고봉밥' 예고	게임메카
팬 기대에 전격 부응한, 마비노기 22주년 판타지 파티	게임메카
[정석희의 기후 에너지 인사이트] 13. '얼마나'가 아니라 '얼마나 오래'	IT동아
프로젝트 글래스윙? 네모트론 연합? 생존 위한 AI 동맹 확산	IT동아
[김흥식 칼럼] 틈만 보이면 올리는 국산차 가격, '살려면 지금 내려라'	오토헤럴드
'제네바는 사라지고 IAA는 변했다' 부산모빌리티쇼의 다음 10년	오토헤럴드
제네시스, 美 신차 품질 평가(IQS) 렉서스 제압...프리미엄 브랜드 2위	오토헤럴드
쏘렌토보다 싼 '헐값' 비상식적 카드 꺼낸 'BYD'.... 프리미엄 '양왕' 검토 (6)	오토헤럴드
현대차, WRC 그리스 랠리 펑크로 '눈물'... 토요타 오지에 69번째 정상 (1)	오토헤럴드
[EV 트렌드] 르노 4·5, 내년 성능 업그레이드 예고 '주행거리·출력 향상'	오토헤럴드
NVIDIA RTX SPARK는 인텔과 AMD의 X86 노트북을 AI를 무기로 정복할 수 있을까? 동영상 있음	보드나라
물을 따라 땅끝까지, 해남의 여름 (1)	트래비
제주의 여름에는 수국이 피어난다 (2)	트래비
[2026 부산모빌리티쇼] 충격적 가격... BYD 씨라이언 6 DM-i 3750만원 출시	오토헤럴드
호세 무뇨스 사장 "SUV 시대? 세단 선호 고객 존재" 포기 안할 것	오토헤럴드
트래비가 제안하는 홋카이도 3박 4일 핵심 일정 [여름편]	트래비
히로시마역 근처에서 노는 방법 \| 쇼핑몰, 도심 트레킹, 카페&호텔 추천 (1)	트래비
드디어 가격 공개된 스팀 머신, 직접 조립하면 얼마? (6)	다나와
'2026 부산모빌리티쇼 개막' 줄어든 완성차 브랜드·확장된 모빌리티	오토헤럴드
[2026 부산모빌리티쇼] 이네오스 그레나디어, 전투기 감성 입은 '그레이캡' 공개	오토헤럴드
[2026 부산모빌리티쇼] 540마력 터보의 픽업트럭 제왕 '2026 램 1500' 공개	오토헤럴드
[2026 부산모빌리티쇼] '국민차의 대변신' 현대차, AI 품은 8세대 아반떼 공개	오토헤럴드
[2026 부산모빌리티쇼] BMW, iX3·7시리즈 한정판으로 미래 전동화 비전 제시	오토헤럴드
[2026 부산모빌리티쇼] 제네시스, 마그마 GT 콘셉트·GMR-001 아시아 최초 공개	오토헤럴드
[2026 부산모빌리티쇼] 기아 'PV5 생태계' 공개, 택배차부터 AI 순찰차까지	오토헤럴드
애플 M6 프로 취소설부터 갤럭시 S27 프로까지… 한주간 최신 IT 루머 (2)	다나와
월드컵 2026 대한민국 축구 대표팀 32강 진출 경우의 수 — AI에게 물어봤습니다 (1)	AI matters
오픈AI ·브로드컴과 합작 추론 칩 공개··· 추론 인프라 생태계 '지각변동'	IT동아
[순정남] 학점 정정 잘 해줄 것 같은 게임 속 교수님 TOP 5 (1)	게임메카
[EV 트렌드] 23년 BMW 출신 수장의 선언 "지커, BMW·벤츠와 동급"	오토헤럴드
지프가 제안하는 가장 대담한 방식 '지붕을 열고 도어를 떼어내다'	오토헤럴드
앤트로픽, '피터 틸 투자사' 페르소나 활용··· AI 민간 감시망 논란 커져	IT동아
[창간] AI 게임 개발 시대 열리니, 기획자 위상 더 높아졌다	게임동아
[모빌리티 인사이트] '자동차를 멈추는 AI' 메모리 반도체 부족 경고등	오토헤럴드
봉고까지 위협하는 기아 PV5, 해외에서 "물량 더 달라" 아우성	오토헤럴드
2026년 새로운 콘솔 스팀 머신... 이거 맞아? (1) 동영상 있음	집마 홀릭TV
페이커의 6회 우승 담았다, T1 2025 월즈 우승 스킨 공개	게임메카
GTA 6 말고도 수두룩, 하반기 패키지 기대작 30선	게임메카
[위클리AI] "AI 검색 더 신뢰할 수 있게" 오픈AI·게티이미지 손잡았다 외	IT동아
[창간] 게임 AI "혁신보다 숫자를 봐야 답이 보인다."	게임동아
태국 원두를 즐길 수 있는 방콕 스페셜티 커피 맛집 4	트래비
[겜ㅊㅊ] 월드컵 기념! 평범함을 거부한 축구게임 6선 (54)	게임메카
영화 <군체> 속 좀비, 실제로 존재할 수 있을까?	과학향기
테슬라, 전기차 수요둔화 대응책으로 '컨테이너 데이터센터' 도전할까	IT동아
'모터쇼 찍고 온천... 1박 코스로 딱 좋네' 부산모빌리티쇼 26일 개막	오토헤럴드
'인간과 딱 3분 차이' 샤오미 YU7, 뉘르부르크링 완전 무인 자율주행 성공	오토헤럴드
[모빌리티 인사이트] 中 나트륨 이온 배터리, 테슬라 수준 제조 품질 확보	오토헤럴드
스팀 실사 드라마 게임 '성세천하'는 어떻게 만들어졌을까	게임메카
MSI와 함께라면 어렵지 않아요. 참 쉬운 컴퓨터 만들기 대회	기글하드웨어
플스5 살 필요 없다??? 25만원이지만 코어 부활로 플스5만큼 좋아져 버린 엄청난 것 동영상 있음	민티저
MSI, '참 쉬운 컴퓨터 만들기 대회' 성료... 초보자 팀이 우승 차지 (1)	미디어픽
EV3는 니로다! 2년 지난 지금도 니로일까? 동영상 있음	오토기어
20년 만의 대변화, 용과 같이 개발사는 왜 새로운 이름을 선택했을까? \| 스트레인저 댄 헤븐 동영상 있음	집마 홀릭TV
현대는 안전 마진 깎아서 100%를 억지로 늘린다? 진짜 위험한 거 아닌가? 동영상 있음	오토기어
컴잘알 시청 금지 (2) 동영상 있음	뻘짓연구소
한국 패키지 게임의 부활... 10년 전엔 감히 상상도 못했다 동영상 있음	집마 홀릭TV
천재적인 앱 만들어서 애플 본사 초청되어 CEO 앞에서 직접 시연한 한국 대학생 동영상 있음	조코딩 JoCoding
[르포] “일상 불편함, 기술로 해결” 다이슨, 100년 된 발전소에서 혁신적인 미래 설계하다	IT동아
팔란티어·오픈AI·엔비디아, '넥스트라이즈 2026' 한자리에···글로벌 기업이 한국으로 향하는 까닭	IT동아
이번 주말 나들이 대구 수성구 '디저트 로드' 어때요? (2)	트래비
커리부어스트부터 학세까지 여행자를 위한 프랑크푸르트 미식 지침서 (1)	트래비
로컬이 알려준 미야자키 카페&디저트 맛집 4 (1)	트래비
[EV 트렌드] '전기차 시장 둔화에도 투자 지속' 마세라티 폴고레 상품성 개선	오토헤럴드
[넥스트 모빌리티] 무한 동력을 향한 끝없는 도전 '태양광 자동차'	오토헤럴드
[모빌리티 인사이트] "수소도 포기 못해" BMW X5가 보여준 현실적 미래	오토헤럴드
앤트로픽 서울 사무실 개소, 한국 AI 생태계 공략 나선다	IT동아
JBL, 새로운 브랜드 슬로건 공개···보컬 제거 마이크·L100 한정판 발표	IT동아
성능은 기본, 안심까지 더했다… 인텔 정품 CPU가 주목받는 이유	미디어픽
[숨신소] 아날로그 감성 가득한 ‘압긍’ 공포게임, 몰	게임메카
페라리 루체, "닛산 리프" 혹평 무색... 15억 몸값에도 예약 폭주	오토헤럴드
현대차 신형 아반떼ㆍ기아 PBVㆍ제네시스 마그마 GT...부산에 뜬다	오토헤럴드
[이구동성] 스팀 생태계 뒤흔든 카멜레온의 등장	게임메카
[포토] 합정 GS25 편의점에 '이환' 포털이 열렸다	게임메카
'시성비' 시대, 엔터 문화에서 찾는 게임의 미래시	게임메카
[AI와 브랜드 경험] AI 시대, 브랜드는 무엇으로 남는가	AI matters
[정보/루머] 인텔+엔비디아 조합의 결실이 2028년에? 및 Zen 6로 개발 중인 라이젠 스레드리퍼 등 (1)	다나와
단1도 새롭지 않은 엔비디아의 개인용 AI 노트북 RTX SPARK의 모든 것 젠슨 황 Q&A까지 동영상 있음	보드나라
IFA 2026 서울 간담회..."혁신의 '예고편' 아닌 '본편' 기대하라"	IT동아
[모빌리티 인사이트] "중국이 등을 돌리자 흔들렸다" 독일차 제국의 위기 (1)	오토헤럴드
[EV 트렌드] 'R2 성공 못하면 끝' 리비안, 신차 출시 직후 구조조정 단행	오토헤럴드
[인터뷰] "더 즐기고 싶다는 목소리에 보답" '그랑블루 판타지 리링크 – 엔드리스 라그나로크'	게임동아
‘고렙 막피’ 막아야 MMORPG 집단전투가 고이지 않는다	게임메카
AI 전환, 넥슨은 아래서 크래프톤은 위에서 시작했다	게임메카

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

리벨리온, AI 양자화 기업 '스퀴즈비츠' 인수··· 전폭적인 AI 생태계 지원 기대

스퀴즈비츠, AI 모델 양자화 및 기술 기업으로 잘 알려져

2025년 vLLM 밋업으로 인연··· 하드웨어·생태계 지원에 광범위한 협력

리벨리온과 스퀴즈비츠의 협업, 어떻게 도움 될까?

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

리벨리온, AI 양자화 기업 '스퀴즈비츠' 인수··· 전폭적인 AI 생태계 지원 기대

공유하기

스퀴즈비츠, AI 모델 양자화 및 기술 기업으로 잘 알려져

2025년 vLLM 밋업으로 인연··· 하드웨어·생태계 지원에 광범위한 협력

리벨리온과 스퀴즈비츠의 협업, 어떻게 도움 될까?

공감/비공감