AMD 회장이자 CEO인 리사 수 박사(Dr. Lisa Su)는 3일 대만 타이페이에서 열린 컴퓨텍스 2024 기조연설에서 'AI 시대 고성능 컴퓨팅의 미래(The Future of High-Performance Computing in the AI Era)'라는 주제로 AMD와 파트너들이 차세대 고성능 PC, 데이터 센터 및 AI 솔루션을 통해 어떻게 한계를 뛰어넘고 있는지에 대한 최신 정보를 공유하는 시간을 가졌다.
이날 AMD는 차세대 Zen 5 마이크로 아키텍처를 기반으로 하는 AMD 라이젠(Ryzen) 9000 시리즈 데스크탑 프로세서와 차세대 AI PC를 위해 강력한 NPU를 탑재한 AMD 라이젠 AI 300 시리즈 프로세서를 선보였다.
또한 데이터 센터용으로 Zen 5 코어를 활용한 5세대 AMD 에픽(EPYC) 프로세서(코드명 Turin)을 미리 공개했으며, 올해 말 출시 예정인 AMD 인스팅트(Instinct) MI325X 가속기를 포함한 확장된 인스팅트 가속기 로드맵을 발표했다.
차세대 Zen 5 아키텍처 라이젠 9000 시리즈 프로세서
코드명 Granite Ridge로 불리던 AMD 라이젠 9000 시리즈 데스크탑 프로세서는 최신 Zen 5 아키텍처를 기반으로 하는 AM5 플랫폼용 CPU로 PCIe 5.0 인터페이스 및 DDR5 메모리를 지원한다.
차세대 고성능 CPU 코어로 개발된 Zen 5 아키텍처는 향상된 분기 예측 정확도 및 대기 시간을 위한 병렬 듀얼 파이프 프론트-엔드를 비롯해 더 넓은 파이프라인과 벡터로 더 높은 처리량, 더 많은 병렬성을 위한 디자인 전반에 걸쳐 더 깊은 윈도우 사이즈 등을 특징으로 한다.
AMD는 Zen 5가 최대 2배의 프론트-엔드 명령어의 대역폭과 L2 to L1 및 L1 to FP 데이터 대역폭, AI 및 AVX-512 처리량을 갖췄으며, 이전 세대 Zen 4 아키텍처에 비해 평균 16% 향상된 IPC 성능을 제공한다고 밝혔다.
이번 컴퓨텍스 2024에서는 라이젠 9000 시리즈 가운데 최상위 모델에 해당하는 AMD 라이젠 9 9950X가 소개됐는데, 16코어 32스레드 구조에 최대 5.7GHz 부스트 클럭, 80MB L2-L3 캐시, 그리고 170W TDP를 가지고 있다.
AMD는 라이젠 9 9950X가 경쟁사 인텔의 14세대 코어 i9-14900K와 비교해 생산성 및 콘텐츠 제작에서 최대 56%, 게이밍에서 최대 23% 성능 향상을 보여준다고 주장했다.
컴퓨텍스에서 공개한 AMD 라이젠 9000 시리즈 제품군은 라이젠 9 9950X를 비롯해 12코어, 8코어, 6코어 등 기존 라이젠 7000 시리즈와 같은 코어 구성에 따른 네이밍이 적용된 것을 볼 수 있다.
새로운 라이젠 9000 시리즈 데스크탑 프로세서는 2024년 7월부터 일반 소비자 및 SI 파트너들에게 공급될 예정이다.
라이젠 9000 시리즈 지원 AMD X870E 및 X870 칩셋 발표
이번 컴퓨텍스 키노트에서는 소개되지 않았지만 새로운 프로세서를 지원하는 소켓 AM5 메인보드 제품군은 두 가지 새로운 칩셋을 내놓을 예정이다.
AMD 라이젠 9000 시리즈 데스크탑 프로세서와 원활하게 통합하도록 설계된 새로운 AMD X870E 및 X870 칩셋은 PCIe 5.0, DDR5, USB4 및 Wi-Fi 7과 같은 최신 기술을 지원한다.
새로운 칩셋은 USB4를 기본 탑재하고 있으며 AMD EXPO 기술을 통해 더욱 빠른 DDR5 메모리 오버클럭을 지원한다. X870E와 X870은 모두 총 44개의 PCIe 레인과 프로세서에 직접 연결되는 PCIe 5.0 NVMe 기능을 갖췄다.
X870E는 16개의 그래픽 전용 레인을 포함한 24개의 PCIe 5.0 레인을 탑재한다. PCIe 5.0 프로세서 스토리지와 그래픽 관리가 동시에 활성화 될 경우 X870E는 경쟁 플랫폼에 비해 2배의 대역폭을 제공한다.
AM4 플랫폼을 위한 새로운 라이젠 5000 시리즈 출시
리사 수 박사는 AMD 소켓 AM4 플랫폼이 오랜 시간 동안 여러 세대의 라이젠 데스크탑 프로세서를 지원했던 점을 언급하면서 이번 AM5용 신제품 뿐만 아니라 AM4를 위한 새로운 라이젠 5000 시리즈 데스크탑 프로세서도 출시할 거라고 밝혔다.
AMD 라이젠 9 5900XT 프로세서는 기존 라이젠 9 5900X이 12코어 24스레드로 구성된 것과 달리 5950X와 같은 16코어 32스레드로 구성되었으며, 72MB 캐시를 가진 것을 보면 5900X의 업그레이드가 아니라 5950X의 다운클럭 모델에 해당하는 것으로 보인다.
AMD 라이젠 7 5800XT 프로세서는 기존 라이젠 7 5800X보다 부스트 클럭이 100MHz 올라간 최대 4.8GHz를 지원하며 CPU 코어 및 캐시 용량은 5800X와 동일하다. 기본 쿨러가 없었던 5800X와 달리 RGB LED가 적용된 AMD Wraith Prism 쿨러가 번들로 제공된다고 한다.
AM4 플랫폼을 위한 라이젠 5000 시리즈는 현재 게이밍에 최적화된 3D V-캐시를 탑재한 모델이 인기를 모으고 있으나 새로 출시되는 제품들은 16코어 이점을 활용한 생산성 및 콘텐츠 제작자를 위한 CPU 업그레이드 및 게임용 8코어 16스레드 CPU에서 최대 부스트 클럭을 더 높여 성능 향상을 꾀한 것으로 보인다.
새로운 라이젠 5000 시리즈 데스크탑 프로세서는 2024년 7월부터 일반 소비자 및 SI 파트너들에게 공급될 예정이다.
AI PC 시대를 위한 3세대 라이젠 AI 300 시리즈 발표
AMD는 컴퓨텍스에서 코드명 Strix Point로 불리던 3세대 AMD 라이젠 AI 300 시리즈 프로세서도 발표했다. 마이크로소프트 코파일럿+(Copilot+) PC를 위한 최고의 프로세서를 표방하는 이 제품은 CPU와 GPU, 그리고 NPU까지 모두 AMD 차세대 아키텍처가 적용된 것이 특징이다.
Zen 5 아키텍처 기반 CPU는 최대 12코어 24스레드까지 구성되며, 최대 16개의 컴퓨트 유닛을 갖춘 AMD RDNA 3.5 GPU, 그리고 50 TOPS 연산이 가능한 AMD 차세대 NPU인 XDNA 2가 적용됐다.
이번에 발표된 라이젠 AI 300 시리즈 프로세서는 12코어 24스레드 CPU와 라데온 890M 그래픽이 내장된 AMD 라이젠 AI 9 HX 370과 10코어 20스레드 CPU에 라데온 880M 그래픽이 들어간 AMD 라이젠 AI 9 365 프로세서 2개로 구성된다. 4nm 공정 기반으로 NPU 연산 성능은 두 제품 모두 50 TOPS이며 TDP는 28W다.
AMD는 3세대 라이젠 AI 300 시리즈 프로세서에 탑재된 XDNA 2 기반 NPU는 멀티태스킹이 2배로 증가한 향상된 AI 타일로 컴퓨트 용량이 5배로 증가하고 전력 효율성은 최대 2배로 좋아졌다고 밝혔다.
또한 8-bit AI 연산 기준으로 마이크로소프트가 요구하는 코파일럿+ 경험을 위한 최소치 40 TOPS보다 훨씬 높은 50 TOPS로 경쟁사 퀄컴과 인텔 프로세서에 적용된 NPU 연산 성능보다 높다는 점을 강조했다.
특히 AI 연산에 적용하는 데이터타입에서 8-bit 정수(INT8)은 성능은 빠르지만 정확도가 떨어지고, 16-bit 부동소수점(FP16) 방식은 정확도는 높으나 성능이 낮은 단점이 있었는데, 3세대 라이젠 AI에 적용된 '블록(Block) FP16'는 INT8의 성능과 FP16의 정확성을 모두 갖추고 있다고 설명했다. 이와 함께 3가지 데이터타입으로 이미지를 생성하는 테스트 결과를 공개했는데, 블록 FP16은 기존 FP16에 비해 속도는 2배 빠르면서 정확도는 비슷한 수준인 것으로 나타났다.
리사 수 박사는 AI PC 시대에 맞춰 코파일럿+ PC 플랫폼을 밀고 있는 마이크로소프트의 윈도우 및 디바이스 부문 부사장인 Pavan Davuluri를 무대로 불러 대화를 나눴는데, 그는 코파일럿+ PC의 최적화된 경험을 위해 50 TOPS의 연산 성능 및 16GB 메모리와 256GB SSD 스토리지가 필요하다고 밝혔다.
이는 3세대 AMD 라이젠 AI 300 시리즈가 제공하는 NPU 성능과 같으며 40~45 TOPS 수준에서NPU 성능을 맞춘 경쟁사들이 이 조건을 충족하기 위해서는 다음 세대 프로세서가 필요하다는 것을 의미한다.
퀄컴 스냅드래곤 X 엘리트와 애플 M4, 그리고 인텔 코어 울트라 9 185H와의 코파일럿+ PC 성능을 비교한 그래프를 보여주면서 라이젠 AI 300 시리즈의 NPU 성능 우위를 내세웠다.
또한 리사 수 박사는 파트너사들과 자사의 3세대 AMD 라이젠 AI 프로세서가 탑재된 신제품과 특징을 소개하는 시간도 가졌는데, HP에서는 라이젠 AI 300 시리즈가 탑재된 노트북과 이를 활용한 블록 FP16 방식 NPU를 통한 Stable Diffusion XL Turbo의 초고속 이미지 생성 능력을 선보였다. 레노버(Lenovo)는 3세대 라이젠 AI 기반 요가(YOGA)를 비롯해 하반기 출시 예정인 개발 중 신제품을 들고 와서 깜짝 공개하기도 했다.
에이수스(ASUS)는 AMD 차세대 AI PC를 노트북 전 라인업에 적용하고 사용자의 사진 및 비디오를 AIf를 통해 자동으로 분류하고 검색할 수 있는 ASUS StoryCube도 소개했다. 또한 게임 시장에서도 ROG 메인보드와 노트북, 휴대용 게임기 등 협력을 이어나가고 있으며 AMD 라이젠 9 시리즈 시장 점유율 60% 이상을 차지할 정도로 프리미엄 제품군에서 강세를 보이고 있다고 언급했다. 그 밖에 서버부터 휴대용 게임까지 전체 생태계에서 AMD와 파트너십을 맺고 있음을 밝혔다.
리사 수 박사는 컴퓨텍스에서 소개한 파트너들 외에도 에이서(Acer)와 MSI까지 3세대 라이젠 AI 기반 100개 이상의 제품들이 다음 달부터 출시될 거라고 언급했다.
AI 시대에 맞춰 모든 솔루션을 제공하는 AMD
AMD는 AI 시대에 맞춰 자사가 모든 IP가 요구하는 전체 엣지 AI 애플리케이션 가속을 위한 솔루션을 제공할 수 있는 회사라는 점을 강조했다. AMD 어댑티브 컴퓨팅(Adaptive Compruting)은 센서 처리 및 융합을 위한 데이터 컨디셔닝을 위한 사전 처리 IP, AMD XDNA는 AI를 통한 예측 및 분석, AMD 임베디드로 포스트 프로세싱까지 모두 처리 가능하다.
2세대 AMD VERSAL AI Edge 시리즈는 AI 임베디드 시스템을 구축하기 위해 필요한 멀티 칩을 싱글 칩 하나로 구현할 수 있으며, 30여개 이상의 전략적 파트너들과 개발 중이라고 밝혔다.
또한 오직 AMD만이 데이터 센터 워크로드에서 요구되는 CPU와 GPU를 모두 만들 수 있는 업체라는 점도 언급했다. 2017년 처음 출시된 AMD 에픽 프로세서는 한 때 옵테론(Opteron)으로 잘 나가다 추락했던 데이터 센터 시장에 다시 복귀해 2018년 2%라는 초라한 점유율로 출발했으나 해를 거듭할수록 점유율이 꾸준히 증가하여 올해 1분기에는 33%의 점유율에 도달했다.
리사 수 박사는 이 같은 성공 비결로 더 많은 CPU 코어를 제공하여 경쟁사보다 높은 성능을 제공한다는 점을 꼽았는데, 2P 서버 기준 인텔 제온 8180 프로세서의 28코어와 비교해 제온 8592+의 64코어 서버는 3.4배의 성능이 향상된 것에 비해 자사의 에픽 9654의 96코어는 5배의 성능 향상을 가져온다고 설명했다.
이는 기존 제온 8180 28코어 서버로는 5대가 필요하던 작업을 AMD 에픽 9654 기반 1대로 처리할 수 있어 서버 공간을 80% 덜 차지하고 에너지 소비도 65% 줄일 수 있다. 4세대 AMD 에픽 9654 프로세서 96코어는 인텔 제온 8592+ 프로세서 64코어보다 엔드 투 엔드 AI 성능에서도 1.7배 빠른 결과를 보여준다.
AMD는 컴퓨텍스에서 5세대 에픽 프로세서인 코드명 Turin도 공개했는데 2024년 하반기 출시 예정으로 알려졌다.
Zen 5 아키텍처를 기반으로 하는 최대 192코어 384 스레드로 구성되며 엔터프라이즈용 Llama 2-7B 구현에서 인텔 제온 8592+ 64코어 시스템보다 3.1배 빠른 성능을 기록했다고 밝혔다. 또한 AI 기반 요약, 챗봇, 번역 등에서도 인텔 대비 2.5배에서 최대 5.4배 빠른 결과를 보였다고 한다.
AI 가속기 분야에서는 기존 AMD 인스팅크 MI300X와 AMD ROCm 개방형 소프트웨어 생태계의 오픈소스 혁신을 소개하면서 stability.ai를 통해 6월 12일로 예정된 생성형AI 소프트웨어 Stable Diffusion 3 공개 액세스를 선보이기도 했다. 작년 출시된 Stable Diffusion XL 1.0 버전은 사람의 손과 같은 부분의 정확도가 떨어지는 문제가 있었는데 이번에 공개되는 Stable Diffusion 3는 그런 부분이 개선된 것으로 알려졌다. 마이크로소프트 및 OpenAI와 협력해 AMD 인스팅트 MI300X를 사용하는 GPT-4 AI 어시스턴트 데모를 시연하기도 했다.
리사 수 박사는 현재 출시된 CDNA 3기반 MI300X 외에 제품 로드앱을 공개했늕데, HBM3E 메모리를 탑재하여 컴퓨트 성능을 끌어올린 MI325X를 올해 출시하고 컴퓨트 및 메모리 성능을 개선한 CDNA 4 기반 MI350 시리즈를 2025년에, 그리고 차세대 아키텍처가 들어가는 MI400 시리즈를 2026년에 내놓을 계획이라고 밝혔다.
컴퓨텍스에서 공개된 AMD 인스팅트 MI325X는 차세대 메모리로 각광받고 있는 HBM3E 메모리를 2배 증가한 최대 288GB 용량으로 탑재하며 메모리 대역폭도 1.3배 증가한 6 TB/s를 구현했다.
올해 4분기 출시 예정인 AMD 인스팅트 MI325X는 엔비디아가 발표한 H200 대비 메모리 용량은 2배, 메모리 대역폭은 1.3배, FP16 및 FP8의 이론상 성능도 최대 1.3배, 서버당 모델 크기도 최대 2배를 지원한다.
내년에 출시할 AMD 인스팅트 MI350 시리즈의 대략적인 특징도 소개했는데 3nm 공정 기술에 MI325X와 같은 최대 288GB의 HBM3E 메모리를 탑재하며, FP16/FP8 뿐만 아니라 FP4 및 FP6 데이터타입도 지원할 거라고 한다.
특히 MI300X 및 MI325X에 들어가는 CDNA 3 아키텍처가 기존 CDNA 2 대비 추론 성능이 8배 가량 증가했는데, MI350 시리즈에 들어가는 CDNA 4 아키텍처는 이러한 CDNA 3 대비 추론 성능이 35배가 증가할 거라고 밝혔다. AMD 인스팅트 MI350 시리즈가 엔비디아에서 발표한 B200 대비 메모리 용량은 1.5배 AI 연산 성능은 1.2배 좋을 거라고도 언급했다.
그 밖에 파트너들과 협력해 고성능 개방형 스케일러블 AI 인프라를 구축하기 위한 울트라 액세스 링크(Ultra Access Link, UA 링크)와 울트라 이더넷(Ultra Ethernet) 컨소시엄에 대해서도 소개했다.
개방형 표준으로 AMD 뿐만 아니라 인텔, 브로드컴, 시스코, 메타, 마이크로소프트 등 여러 IT 기업들이 참여하고 있지만 AMD는 에픽 프로세서와 인스팅트 GPU까지 더해 AI 데이터 센터를 위한 모든 솔루션을 제공할 수 있다는 점을 내세웠다.
이미지 및 내용 출처: AMD
Copyrightⓒ 넥스젠리서치(주) 보드나라 미디어국. www.bodnara.co.kr