알리바바(Alibaba)가 클라우드 인프라와 모델 서비스, AI 칩, 파운데이션 모델을 아우르는 ‘AI 풀스택 업그레이드’를 발표했다. 고객이 AI 에이전트를 더 효율적이고 안정적으로, 또 높은 성능으로 구축·배포·확장하도록 돕겠다는 취지다. 5월 20일 열린 알리바바 클라우드 서밋에서 공개됐다.
중심에는 최신 대규모언어모델(LLM) ‘Qwen3.7-맥스(Qwen3.7-Max)’가 있다. 고도화된 에이전틱 코딩과 복잡한 추론, 장기 작업에 최적화된 범용 기반 모델로, 코드 생성·디버깅부터 오피스 워크플로 자동화, 수백~수천 단계의 멀티스텝 작업까지 처리한다. 특히 성능 저하 없이 최대 35시간 연속 작동하며 1,000회 이상 툴을 호출할 수 있다. 오픈클로(OpenClaw), 클로드 코드(Claude Code) 등 주요 에이전트 프레임워크에 최적화돼 있으며, 향후 알리바바 모델 서비스 플랫폼 ‘모델스튜디오’를 통해 전 세계 개발자에게 제공될 계획이다.
인프라도 함께 손봤다. 알리바바 클라우드는 신규 AI 프로세서 ‘전우 M890(Zhenwu M890)’과 ‘ICN 스위치 1.0’ 네트워킹 칩을 탑재한 ‘판주 AL128(Panjiu AL128)’ 슈퍼노드 서버를 중국 시장용으로 공개했다. 단일 랙에 128개의 AI 가속기를 집적해 초당 페타바이트(PB/s)급 대역폭을 내며, 에이전트의 대규모 동시 요청 처리 성능을 끌어올렸다는 설명이다.
반도체 설계 자회사 T-헤드(T-Head)가 내놓은 전우 M890은 이전 모델 대비 3배 향상된 성능을 표방한다. 144GB GPU 메모리와 초당 800GB의 칩 간 대역폭을 갖췄고, FP32부터 FP4까지 다양한 정밀도를 기본 지원해 고정밀 학습과 초저정밀 추론을 모두 다룬다. 대용량 작업 메모리와 고속 통신이 필요한 복잡한 에이전틱 AI 작업에 맞춘 칩이라는 게 회사 측 설명이다.
자세한 내용은 알리바바 클라우드에서 확인할 수 있다.
이미지 출처: 알리바바
AI Matters 뉴스레터 구독하기








