AMD는 미국 현지시각 6월 12일(한국시간 6월 13일) 연례 행사 ‘2025 어드밴싱 AI(2025 Advancing AI)’에서 자사의 AI 플랫폼 비전과 차세대 AI 인프라 전략을 발표했다. 이번 행사에서 AMD는 업계 표준 기반의 개방형이며 확장 가능한 랙 스케일 AI 인프라를 공개하고, 이를 뒷받침할 하드웨어와 소프트웨어, 광범위한 파트너십 사례를 소개했다.
AMD 리사 수(Lisa Su) CEO는 “AMD는 전례 없는 속도로 AI 혁신을 주도하고 있으며, 이번 인스팅트 MI350 시리즈 가속기 출시와 차세대 ‘헬리오스(Helios)’ 랙 스케일 솔루션, ROCm 개방형 소프트웨어 스택의 성장으로 그 영향력을 더욱 강화하고 있다”고 강조했다. 그는 “개방형 표준과 공동 혁신, 그리고 AI의 미래를 정의하는 폭넓은 하드웨어 및 소프트웨어 파트너 생태계 전반에서 AMD의 리더십을 확대하고 있다”고 밝혔다.
AI 전체 스펙트럼을 아우르는 AMD 솔루션 포트폴리오
AMD는 인스팅트 MI350 시리즈 GPU를 새롭게 공개하며 생성형 AI와 고성능 컴퓨팅(HPC) 분야에서 성능과 효율성, 확장성 측면에서 새로운 기준을 제시했다. 이번 MI350 시리즈는 인스팅트 MI350X와 MI355X GPU 및 플랫폼으로 구성되며, AI 컴퓨팅 성능은 이전 세대 대비 4배, 추론 성능은 35배 향상됐다. 특히 MI355X는 경쟁 솔루션 대비 최대 40% 더 높은 달러당 토큰 생성 성능을 제공한다.
MI350
또한 AMD는 MI350 시리즈 가속기, 5세대 AMD 에픽(EPYC) 프로세서, AMD 펜산도(Pensando) 폴라라 NIC를 활용한 엔드투엔드 오픈 스탠다드 기반 랙 스케일 AI 인프라도 선보였다. 이 인프라는 이미 오라클 클라우드 인프라스트럭처(OCI)에서 운영 중이며, 2025년 하반기부터 광범위하게 출시될 예정이다. 이와 함께 AMD는 MI400 시리즈 GPU 기반 차세대 AI 랙 ‘헬리오스’를 선공개했다. 헬리오스는 ‘젠 6(Zen 6)’ 아키텍처 기반 에픽 ‘베니스(Venice)’ CPU와 펜산도 ‘불카노(Vulcano)’ NIC를 탑재해 MoE(Mixture of Experts) 모델 추론 성능을 이전 세대 대비 최대 10배 향상시킨다.
MI350X
AMD는 이번 행사에서 오픈소스 AI 소프트웨어 스택인 ROCm 7도 발표했다. ROCm 7은 생성형 AI와 HPC 워크로드를 지원하며, 업계 표준 프레임워크와의 호환성을 높이고 하드웨어 지원, 개발 도구, 드라이버, API, 라이브러리 등에서 전반적인 개발자 경험을 대폭 향상시킨다.
에너지 효율 면에서도 AMD는 주목할 만한 성과를 공개했다. MI350 시리즈는 AI 트레이닝 및 HPC 노드에서 5년간 30배 향상 목표를 넘어 38배 에너지 효율 개선을 달성했다. AMD는 2030년까지 2024년 대비 랙 스케일 에너지 효율을 20배 향상시키겠다는 새로운 목표도 발표했다. 이는 기존에 275개 이상의 랙이 필요했던 AI 모델 학습 작업을 단 1개 이하의 랙으로 처리할 수 있는 수준의 전력 소비 절감을 의미한다.
또한 AMD는 전 세계 개발자와 오픈소스 커뮤니티를 위한 AMD 개발자 클라우드도 광범위하게 출시한다고 밝혔다. 이 클라우드는 고성능 AI 개발에 최적화된 완전 관리형 환경을 제공하며, ROCm 7과 함께 개발자들이 AI 프로젝트를 빠르게 시작하고 확장할 수 있도록 지원한다. AMD는 허깅 페이스(Hugging Face), 오픈AI(OpenAI), 그록(Grok) 등과 전략적 협력을 통해 개방형 AI 생태계를 더욱 강화하고 있다.
AI 혁신을 선도하는 파트너 생태계 구축
현재 세계 10대 AI 및 모델 구축 기업 중 7곳이 AMD 인스팅트 가속기를 기반으로 프로덕션 워크로드를 운영하고 있다. 행사에 참석한 메타(Meta), 오픈AI(OpenAI), 마이크로소프트(Microsoft), xAI 등 주요 파트너 기업들은 다양한 분야에서 AMD 솔루션을 활용한 혁신 사례를 공유했다.
메타는 자사 라마 3(Llama 3) 및 라마 4(Llama 4) 모델 추론에 인스팅트 MI300X를 광범위하게 활용 중이며, MI350의 연산 성능과 TCO 대비 성능, 차세대 메모리에 큰 기대를 나타냈다. 향후 MI400 시리즈 플랫폼 도입 계획도 공개했다.
오픈AI의 샘 알트만(Sam Altman) CEO는 하드웨어, 소프트웨어, 알고리즘 전반에서 최적화의 중요성을 강조하며, MI300X 기반 애저(Azure) 인프라에서 GPT 모델 연구와 MI400 시리즈 플랫폼 설계에 심층적으로 참여하고 있다고 밝혔다.
오라클 클라우드 인프라스트럭처(OCI)는 업계 최초로 AMD 개방형 랙 스케일 AI 인프라를 도입했으며, 최대 131,072개의 MI355X GPU로 가속화되는 제타스케일 AI 클러스터를 운영 중이다.
휴메인(HUMANE)은 AMD의 전 제품군 컴퓨팅 플랫폼을 활용해 개방적이고 탄력적이며 비용 효율적인 AI 인프라 구축에 성공했다고 소개했다.
마이크로소프트는 MI300X를 애저 내 독점 모델과 오픈소스 모델 양쪽에서 활용하고 있으며, 코히어(Cohere)는 자사의 커맨드 R+(Command R+) 모델이 MI300X 기반에서 높은 처리량과 데이터 프라이버시를 제공하고 있다고 전했다.
레드햇(Red Hat)은 레드햇 오픈시프트 AI(Red Hat OpenShift AI)에 AMD 인스팅트 GPU를 도입해 하이브리드 클라우드 전반에 효율적인 AI 인프라 기반을 마련했다고 발표했다.
아스테라 랩스(Astra Labs)는 개방형 UA링크(UALink) 생태계를 통해 AI 인프라 혁신을 가속화하고 있으며, 마벨(Marvell)은 UA링크 컨소시엄 일원으로서 AI 인프라에 최상의 유연성을 제공하는 인터커넥트 개발 협력을 강조했다.
이번 2025 어드밴싱 AI 행사에서 AMD는 AI 산업 전반에서 개방형 생태계를 중심으로 한 기술 혁신과 에너지 효율 개선 목표를 제시하며 차세대 AI 인프라 시장에서의 리더십을 한층 강화했다는 평가다.
김종혁 기자/news@newstap.co.kr
ⓒ 뉴스탭(https://www.newstap.co.kr) 무단전재 및 재배포금지
[뉴스탭 인기 기사]
· 카시오, 풀 메탈 G-쇼크 신제품 2종 출시…하이브리드와 디지털 모델 동시 공개
· 스팀덱이 키보드 속으로…무선 키보드 형태 PC ‘Bento’ 등장
· 블랙베리 클래식, 중국 기업 손에서 부활…'Zinwa Q25'로 재탄생
· 홈플러스, 몰로코와 손잡고 리테일 미디어 광고 본격 진출
· 스페이스X, 스타링크 V3로 1Tbps 시대 연다…지연시간 5ms까지 단축