AMD는 컴퓨텍스 2024의 시작을 알리는 개막 기조연설에서 젠5 아키텍처의 라이젠 9000 시리즈 프로세서, 3세대 AMD 라이젠 AI 300 시리즈 프로세서, 5세대 에픽 프로세서 코드네임 튜린, AMD 인스팅트의 새로운 아키텍처를 소개했습니다.
시작하기 전 광고 시간. 컴퓨텍스 팝업 스토어에서 과이과이 과자를 팝니다.
과이과이는 이제 대만 IT를 대표하는 밈으로 자리잡는 모양새입니다.
단순히 AMD라는 회사의 발표가 아니라 컴퓨텍스의 개막을 알리는 개막 연설이기에, 본격적으로 시작하기 전에 대만 IT 업계와 컴퓨텍스 관계자들이 나와서 한마디씩 하십니다.
음양 사상을 AI에 엮고, 그 동안 대만 IT 업계와 컴퓨텍스가 어떻게 발전해 왔는지를 소개합니다.
컴퓨텍스는 처음 시작했을 때만 해도 단순한 컴퓨터 박람회였으나, 갈수록 다루는 분야가 늘어나더니 이제는 AI를 대대적으로 푸시하고 있습니다.
업계의 다양한 파트너들이 참여합니다. 이미지 가운데에 있는 회사들은 서구권에 있지만, 그 주변에 TSMC나 MSI를 비롯한 대만 회사들이 자리잡고 업계의 발전을 지원하고 있다, 뭐 그런 내용입니다.
이번 컴퓨텍스는 6개의 주제로 진행됩니다. 컴퓨터는 말할 것도 없고 여기에서도 AI를 강조합니다.
업계를 대표하는 사람들의 연설이 진행됩니다.
이제 AMD의 개막 연설 차례인데요.
AMD 로고가 변하더니-
AI가 됩니다. 그만큼 AI에 신경을 쓰고 비중을 크게 두고 있다는 의미로 보입니다.
리사 수 CEO가 직접 키노트를 진행했습니다.
AMD는 클라우드부터 PC까지 다양한 분야에서 AI 인프라를 구축하고 있습니다.
AMD의 AI 플랫폼은 훈련과 추론 하드웨어, 오픈소스 소프트웨어, AI 생태계 등으로 이루어집니다. AI는 이런 자리에서 항상 오픈 소스와 소프트웨어 생태계를 강조하더라고요.
이번 컴퓨텍스의 주인공은 크게 2가지. 차세대 CPU 코어인 젠5와 차세대 NPU 코어인 XDNA2입니다.
이 새로운 아키텍처는 게이밍 PC를 위한 라이젠 프로세서, AI PC를 위한 라이젠 AI 프로세서에 탑재됩니다.
우선 게이밍부터 봅시다. AMD의 제품은 게이밍 PC, 콘솔 게임기, 휴대용 게임기까지 모든 분야에 포진하고 있습니다.
코드네임 그래닛 릿지, 라이젠 9000 시리즈 프로세서를 발표했습니다. 젠5 아키텍처, AM5 플랫폼, PCIe 5.0, DDR5 메모리를 갖췄습니다.
젠5 아키텍처는 분기 예측의 정확도와 레이턴시를 개선하고, 더 넓어진 파이프라인과 벡터 출력을 높이고, 더 깊어진 윈도우 사이즈로 병렬 처리에 최적화됐습니다.
젠5 코어는 명령어 대역폭, 데이터 대역폭, AI 성능이 최고 2배 오릅니다.
젠5 아키텍처는 젠4와 비교해서 16%의 IPC 상승을 달성했습니다.
그 대표적인 제품은 라이젠 9 9950X입니다. 16코어 32스레드, 최고 클럭 5.7GHz, 80MB 캐시, 170W TDP입니다.
라이젠 9 9950X.
코어 i9-14900K와 비교하면 컨텐츠 제작과 프로덕티비디, 게임 성능에서 모두 앞서는 모습을 보여줍니다.
PCIe 5.0을 지원하고 LLM 역시 지원합니다.
소켓 변경 없이 AM5를 그대로 유지합니다. AM5는 2027년 이후에도 계속해서 사용될 예정입니다.
라이젠 9000 시리즈에 맞춰서 X870/X870E 칩셋을 발표했습니다. AM5 소켓을 유지하니까 굳이 새 칩셋을 스지 않아도 라이젠 9000 시리즈의 사용엔 문제가 없겠지만, X870 시리즈 칩셋은 USB 4.0, PCIe 5.0 그래픽과 NVMe, 더 높은 EXPO 메모리 클럭을 지원합니다.
라이젠 9000 시리즈는 9950X 외에도 9900X, 9700X, 9600X가 있으며 2024년 7월에 나옵니다.
또 AM4 소켓의 라이젠 9 5900XT와 라이젠 7 5800XT도 새로 출시합니다. 이것도 7월에 나옵니다.
라이젠 9 5900XT는 16코어 32스레드를 지녀 컨텐츠 제작과 게임 성능이 뛰어납니다.
라이젠 7 5800XT도 코어 i5-13600KF보다 더 높은 성능을 냅니다.
이제 AI로 넘어가 봅시다.
기존의 AI PC는 10~16TOPS의 성능을 내는 NPU를 지녔으나, AMd의 3세대 AI PC는 50TOPS의 성능을 제공해 코파일럿+를 완벽 지원합니다.
코파일럿+의 리콜, 실시간 자막과 번역, 코크리에이터 등의 기능을 자유자재로 쓸 수 있습니다.
라이젠 AI 300 시리즈입니다. 이것도 젠5 아키텍처 CPU를 사용했고, XDNA2 NPU와 RDNA 3.5 GPU를 탑재했습니다.
3세대 라이젠 AI 프로세서는 50TOPS의 성능을 내는 XDNA2 NPU, 12코어 24스레드까지 가능한 젠5 CPU, 16개 컴퓨트 유닛으로 구성되는 RDNA 3.5 GPU를 조합했습니다.
라이젠 AI 300 시리즈는 라이젠 AI HX 370과 라이젠 AI 9 365의 두 가지 모델이 우선 나옵니다. 10코어 20스레드와 12코어 24스레드가 있으며 그래픽은 라데온 890M와 880M입니다.
3세대 라이젠 AI 프로세서부터는 제품 명명 규칙이 이렇게 바뀝니다. AMD 라이젠 AI까지 브랜드고, 그 다음에 브랜드 레벨과 제품 시리즈, SKU가 붙습니다.
XDNA2 NPU는 연산 용량과 전력 효율이 모두 크게 개선됐습니다.
현재 나온 NPU 중에서 최고의 성능을 제공합니다. 애플 M4나 스냅드래곤 엘리트 X, 그리고 아직 발표하지 않은 인텔 루나레이크보다도 앞섭니다.
AMD의 기존 AI 프로세서와 비교해도 훨씬 더 높은 성능을 냅니다.
AI 연산은 속도가 빠른 INT8과 정확도가 높은 FP16이 있는데
AMD XDNA2 아키텍처는 최초로 블럭 FP16을 지원하는 NPU입니다. AI 모델의 파라미터 비트 수를 낮추는 양자화 처리가 필요하지 않아 속도와 정확도를 모두 잡았다고 설명합니다.
코파일럿+ PC라고 해서 다 같은 게 아닙니다. 스냅드래곤 X 엘리트 탑재 모델보다 더 높은 성능을 냅니다.
애플 M3보다 우수한 작업 성능을 지녔습니다.
인텔은 말할 것도 없습니다.
높은 성능의 내장 그래픽은 AMD의 한결같은 자랑거리지요.
라이젠 AI 300 시리즈는 100+개 이상의 플랫폼으로 2024년 7월에 나올 예정입니다.
AMD 프로세서를 사용하는 파트너들도 나와서 한마디씩 거들었습니다. MS
HP
레노버
그리고 ASUS.
ASUS는 AMD의 AI 프로세서를 사용한 모델들을 여럿 준비했고
메인보드부터 노트북, 게임기까지 다양한 제품을 출시해
AMD R9 시리즈 시장의 60% 이상을 차지했습니다.
또 MSI에서도 AMD AI 프로세서를 탑재한 제품들을 준비하고 있습니다.
이제 서버/데이터센터 차례입니다.
AMD XDNA와 어댑티브 컴퓨팅 제품군은 여러 엣지 AI 생태계의 성장에 기여하고 있습니다.
대표적인 채용 사례로 일루미나를 소개했습니다.
또 히타치와
캐논이 AMD 어댑티브 컴퓨팅을 사용하고 있습니다.
AMD 버설 AI 엣지 시리즈 Gen2는 기존에 여러 칩으로 나뉘어져 있던 AI 임베디드 시스템을 하나의 칩으로 통합했습니다.
30개 이상의 전략적인 파트너가 오늘부터 2세대 버설 AI 엣지 제품을 얼리 액세스로 제공합니다.
오직 AMD만이 CPU부터 GPU까지 데이터센터 워크로드의 모든 범위를 커버합니다.
에픽이 처음 나왔을 때만 해도 시장 점유율이 2%밖에 되지 않았으나 지금은 33%까지 올랐습니다.
이런 성장이 가능한 이유는 역시 성능입니다. 경쟁사보다 훨씬 더 높은 성능을 제공하거든요.
1개의 CPU에서 더 많은 수의 코어를 제공하면서 더욱 공간/전력 효율적인 데이터센터 시스템을 구축할 수 있게 됐습니다.
4세대 에픽 프로세서의 AI 성능입니다.
그리고 이제는 젠5 아키텍처를 사용한 5세대 에픽, 코드네임 튜린이 나올 차례가 됐습니다. SP5 소켓을 유지하고 최대 192코어 384스레드의 프로세서가 출시됩니다.
튜린, 5세대 에픽 프로세서입니다.
128개에 달하는 압도적인 수의 코어로 성능 격차를 더욱 크게 벌렸습니다.
경쟁 상대인 인텔과 작업 처리 시간 비교.
성능 비교.
5세대 에픽 프로세서는 올해 하반기에 출시됩니다.
다음은 인스팅트 가속기를 소개할 차례입니다.
인스팅트 MI300X 가속기는 AMD 역사상 가장 빠르게 보급된 제품입니다.
여러 파트너와 다양한 AI 모델을 지원합니다.
ROCm 오픈소스 소프트웨어 생태계도 강조했습니다.
ROCm6 소프트웨어의 처리 속도입니다. MI300X와 H100이라니 최신 제품으로 소개할만한 것들은 아닌데요. 그 이유는 아래에 나옵니다.
스테이빌리티.ai의 CEO가 나와 AMD의 뛰어난 성능을 강조했습니다.
스테이블 디퓨전 3가 6월 12일에 공개된다는 발표도 했습니다.
이전 세대보다 더 나은 이미지를 그려내고-
AMD의 성능이 뛰어나다는 걸 다시 한번 강조했습니다.
MS CEO인 사티아 나델라도 AMD의 AI 성능을 극찬했습니다.
AMD 인스팅트 MI300X 가속기는 MS 애저를 비롯해 마이크로소프트가 많은 양을 운용 중입니다.
인스팅트 MI300X에서 구동하는 GPT-4의 데모.
차세대 CDNA 아키텍처의 로드맵이 나왔습니다. 올해 CDNA3 아키텍처에 HBM3E 메모리를 조합한 MI325X가 출시되고, 내년에는 CDNA4 아키텍처로 업그레이드해 성능과 메모리를 개선한 MI350이 나옵니다. 2026년에는 그 다음 세대 아키텍처의 MI400이 나옵니다.
여기서 한가지 궁금한 점이... AMD는 제품 이름에서 숫자를 아낌없이 팍팍 쓰고 있는데요. 2025년의 MI350은 CDNA4로 아키텍처를 바꿈에도 불구하고 제품명은 여전히 MI300 시리즈를 유지한다는 겁니다. RDNA4가 플래그쉽 모델은 없고 RDNA3를 단점을 보완하는 아키텍처라고 알려져 있는데, CDNA4와 CDNA3의 관계도 비슷하기에 인스팅트 모델명 넘버를 크게 올리지 않는 걸까요?
하여간, 인스팅트 MI325X가 나옵니다. HBM3E 288GB 메모리가 탑재됩니다.
앞에서 H100과 MI300X보고 한 세대 전 제품의 비교라 했는데요. MI325X에서는 H200과 비교해도 더 나은 성능을 제공합니다.
또 인스팅트 MI350 시리즈도 예고했습니다. 이건 3nm 공정을 사용하는데, 향간에는 AMD가 삼성의 3nm 공정을 쓸거라는 소문이 있지요.
CDNA3의 까마득한 추론 성능 향상.
다른 분야에서의 성능 향상.
데이터센터에서 사용하는 GPU의 수가 늘어나면서, 이를 확장하고 연결하는 일이 중요해졌습니다.
그래서 AMD는 업계의 다른 회사들과 함께 울트라 액셀레이터 링크를 추진하고 있습니다. GPU 뿐만 아니라 모든 프로세서를 연결하는 것이 목표입니다. 사실상, 독자 규격인 NVLink를 사용하는 NVIDIA만 빼고 다 참여하는 규격입니다.
이더넷에서도 다른 여러 회사들과 함께 울트라 이더넷을 도입합니다. 이것도 NVIDIA에 맞서는 그림이 그려지는데요. UAL도 그렇고 울트라 이더넷도 그렇고 AMD와 인텔이 같은 쪽에 서 있는 게 흥미롭네요.
AMD는 이렇게 에픽 프로세서, 인스팅트 GPU, UA링크와 울트라 이더넷 네트워크를 조합한 AI 데이터센터를 준비하고 있습니다.
오늘 발표한 제품들입니다.
발표회장에서 언급하진 않았지만 라데온 프로 W7900의 듀얼 슬롯 모델도 출시합니다.
두께를 줄여서 하나의 시스템에 더 많은 수의 그래픽카드를 쉽게 장착할 수 있습니다.
이건 6월 19일에 출시됩니다.
<저작권자(c) 기글하드웨어 무단전재-재배포금지>