지난 6월 초, 컴퓨텍스가 한창일 때, 7월에 미국에서 열리는 AMD 테크데이에 참석하겠냐는 연락을 받았습니다. 마침 컴퓨텍스에서 라이젠 9000과 라이젠 AI 300 시리즈를 막 발표했고, 성능이 얼마나 향상됐는지는 공개했지만 그걸 어떻게 달성했는지 설명하지 않았기에 테크데이에서 그 이야기를 들을 수 있을 거라고 생각했습니다. 그런데 막상 가서 보니 젠5라는 CPU 아키텍처와 거기에서 파생된 제품을 소개하는 것은 테크데이의 일부일 뿐이더라고요. AMD는 신형 아키텍처 그 이상의 큰 그림을 보여주기 위해 사람들을 불러 모았다는 인상을 심어 줬거든요. 바로 AI PC 말이죠.
물론 저같은 전통적인 하드웨어 매니아, 좀 더 솔직하게 말해서 컴퓨터 꼰대 입장에선 아직도 여전히 감이 잘 오지 않는 AI의 활용 방안이나 기술 발전보다는, 어떤 신비롭고도 기발한 방법으로 CPU의 성능을 끌어 올렸을지에 더 관심이 끌릴 수밖에 없습니다. 하지만 시대는 변하고 있고 고전적인 방식으로 성능 향상을 견인하는 데엔 한계가 있기 마련이지요. AMD가 이번 테크데이에서 젠5라는 CPU 아키텍처의 혁신을 소개하면서 AI 기술에 적지 않은 비중을 둔 것도, 결국은 성능 향상이란 목적을 달성하기 위해 다각도로 고민을 거듭한 끝에 나온 결단일 것입니다.
AMD 그래픽/클라이언트 채널 CVP 겸 GM인 데이비드 맥아피는 테크데이의 시작을 알리는 인사와 함께, "우리 산업은 AI에 의해 재편되고 있으며, AI는 우리가 일하고 소통하며 삶을 즐기는 방식을 변화시키고 있다"면서, "역사적으로 중요한 이 순간에 AMD는 젠5 8코어 CPU, RDNA 3.5 그래픽, XDNA2 AI 엔진, 뛰어난 배터리 성능을 지닌 스트릭스 포인트를 소개하고자 한다"고 말했습니다. 또 스트릭스 포인트는 '현재 시장에서 타협하지 않은 유일한 AI PC 솔루션'이라고 강조했습니다.
데스크탑의 경우 IPC 16% 향상을 달성한 젠5 아키텍처를 사용한 그래닛 릿지(라이젠 9000 시리즈)를 준비했으며, 이는 게이머, 개발자, 컨텐츠 제작자를 위한 최고의 솔루션임을 강조했습니다.
본격적인 기술 소개에 앞서, 라이젠 AI 300 시리즈 프로세서가 탑재되고 마이크로소프트의 코파일럿+PC에 부합하는 ASUS의 노트북들을 소개했습니다. 윈도우 on Arm으로 퀄컴이 노트북 시장에 뛰어든 가운데, AMD는 압도적인 성능과 기능, 거기에 역대급 물량으로 정면 승부를 벌이겠다는 메세지로 보입니다.
이제 본론입니다. 젠5와 RDNA 3.5 아키텍처의 업데이트는 AMD의 마크 페이퍼마스터(EVP and Chief Technology Officer)가 소개했습니다.
젠5 아키텍처는 하나의 사이클에서 더 많은 명령어를 전달하고, 디스패치와 실행 폭을 확장했으며, 캐시 대역폭을 두배로, AI 가속을 더했습니다. 구체적으로는 아래에서 소개한 방법들을 사용했습니다.
듀얼 파이프 페치와 개선된 분기 예측입니다. 분기 예측의 레이턴시를 줄이고 정확도와 출력은 높였습니다. 명령어 캐시 레이턴시와 대역폭은 향상시키고, 디코드 파이프는 배로 늘렸습니다.
더 넓어진 디스패치와 실행 유닛입니다. 8와이드 디스패치/리타이어 구조, 6개의 ALU와 3개의 곱센으로 구성, 더욱 통합된 ALU 스케줄러, 더 커진 실행 윈도우 등이 여기에 포함됩니다.
데이터 대역폭을 향상시킨 방법은 이렇습니다. 4사이클로 데이터를 불러오는 48KB 12웨이 L1 데이터 캐시, L1 캐시와 부동소수점 유닛 대역폭을 최대 두배로 개선, 데이터 프리페칭을 개선했습니다.
512비트 AI 데이터패스라고 하면 뭔가 궁금하실텐데 AVX-512를 제대로 지원한다는 소리입니다. 256비트 패스 2개를 쓰는 게 아니라 완전한 512비트 패스를 썼다는 말이죠. 그래서 AVX-512 성능이 대폭 향상됩니다. 또 2사이클 레이턴시 FADD의 파이프라인 6개와 더 큰 부동소수점 명령 처리가 있습니다.
이런 변화 덕분에 젠5는 젠4와 비교해서 평균 16%의 IPC 향상을 달성했습니다.
또 산술 가속 유닛의 성능이 대폭 향상되어, 싱글코어 머신 러닝 성능은 젠4보다 32%, AES-XTS는 35%가 올랐습니다.
각각의 개선점들이 젠5의 성능 향상에서 차지하는 비중입니다.
젠5는 더 빠르고 작고, 전력 사용량이 낮은 트랜지스터를 사용합니다. 생산은 TSMC의 3nm와 4nm를 사용하며 개선된 메탈 스택을 도입했습니다. 또 AMD가 자랑하는 모듈러 디자인(칩렛) 덕분에 하나의 설계를 다양한 제품에 적용할 수 있습니다.
이제 모바일 프로세서를 봅시다. 3세대 AMD 라이젠 AI 프로세서, 스트릭스 포인트는 칩렛이 아닌 하나의 다이를 사용합니다. 이 안에는 2개의 코어 클러스트가 있어(젠5와 젠5c) 하나는 최고 성능에, 다른 하나는 출력 효율에 최적화됐습니다. 모바일에 맞춰 설계된 프로세서답게 전력 효율을 최적화했습니다.
젠5는 서버 프로세서에도 사용합니다. 올해 하반기에 나오는 5세대 에픽 프로세서, 코드네임 튜린은 192코어 384스레드로 구성되며 AI와 IO 등이 강화됩니다.
젠5가 나왔으니 그 다음은 젠6겠지요. AMD는 업계 최고 수준의 공정을 앞장서서 사용합니다.
RDNA 3.5 아키텍처입니다. 새로운 숫자가 아니라 0.5라고 붙인 걸 보면 아시겠지만, 모바일 프로세서에 맞춰서 전력 효율을 개선한 아키텍처입니다. 그래서 더 낮은 전력으로 더 높은 성능과 메모리를 제공하면서 배터리 사용 시간도 늘렸습니다.
RDNA 4가 아니라 3.5니까 변화 폭이 크지 않아 보이지만 그렇지도 않습니다. 텍스처 샘플러 레이트를 2배로 늘리고, 보간과 압축을 2배로 개선했으며 메모리 관리를 최적화해 효율을 높였습니다.
스트릭스 포인트와 그 이전작인 호크 포인트의 성능을 비교하면 19~32%의 향상이 있습니다. 다른 조건이 모두 같은데 이 정도로 성능이 올랐다면 새로운 아키텍처로 취급해도 되지 않을까요?
다음은 라이젠 9000 시리즈 데스크탑 프로세서의 소개입니다. 앞에 나왔던 AMD 그래픽/클라이언트 채널 CVP 겸 GM인 데이비드 맥아피가 진행했습니다.
라이젠 9000 시리즈 데스크탑 프로세서는 뛰어난 성능, 높은 효율, 극한 오버클럭, 플랫폼 지속성을 특징으로 합니다. 써놓고 보니 4개 다 인텔한텐 없는 것이네요. 성능은 밀리고, 전기는 많이 먹고, 오버클럭하라고 만든 K 시리즈는 안정성 문제가 터지고, 소켓은 허구한날 바꿔대고 있으니까요.
라이젠 9000 시리즈는 컴퓨텍스에서 예고한대로 4개의 제품이 우선 출시됩니다. 제품 라인업과 코어 구성 등은 이전 세대와 같으나, 하위 모델들의 TDP가 많이 줄었습니다.
라이젠 9 9900X와 코어 i9-14900K의 성능 비교.
라이젠 7 9700X와 코어 i7-14700K의 성능 비교.
라이젠 5 9600X와 코어 i5-14600K의 성능 비교.
4개가 출시됐는데 왜 그래프 비교는 3개밖에 없냐고요? 라이젠 9 9950X는 적수가 없거든요.
라이젠 7 5800X3D는 압도적인 게임 성능을 지녀 2세대 전 제품임에도 불구하고 여전히 높은 평가를 받고 있는데요. 이제는 아닐 겁니다. 전기를 훨씬 덜 먹는 라이젠 9700X가 그보다 더 높은 성능을 내거든요.
라이젠 9000 시리즈는 전기를 덜 사용하고, 온도가 낮으며, 조용한 시스템을 만들 수 있습니다.
열 저항 성능이 향상되고 더 낮은 온도에서 작동합니다. TDP가 같을 경우 7도 가량 온도가 낮다고 하네요.
라이젠 9 9950X만 이전 세대와 같은 170W를 유지하고, 다른 제품들은 모두 TDP가 줄었습니다. 그러면서도 성능은 올랐지요.
오버클럭도 개선됐습니다. 새로운 AGESA 마이크로코드에서 DDR5-8000 메모리를 지원하며, 새로운 메모리 최적화 프로파일이 추가됐습니다. 또 커브 쉐이퍼라는 오버클럭 기능이 추가됐습니다.
프리시전 부스트 오버드라이브를 사용하면 설정 한 번만으로 오버클럭이 됩니다. 제품마다 다르지만 6~15%까지 오르네요.
소켓 AM4는 나온지 9년 가까이 됐는데도 아직도 새로운 제품이 나오고 있습니다. 소켓 AM%는 최소 2027년까지 제품이 계속해서 나올 예정입니다.
AMD 800 시리즈 칩셋입니다. 고급형 칩셋은 PCIe 5.0과 USB 4를 지원하며, 보급형 모델도 오버클럭이 가능합니다.
PCIe 5.0 SSD와 여러 그래픽카드를 함께 장착할 수 있으니, 고성능 AI 시스템 구축에도 유리합니다.
AVX512/VNNI 가속을 지원해 대규모 언어 모델 처리 성능이 뒤어납니다.
라이젠 9000 시리즈 데스크탑 프로세서는 7월 31일에 출시됩니다.
라이젠 AI 300 시리즈 프로세서는 클라이언트 비즈니스 개발 CVP인 제이슨 밴타가 소개했습니다.
라이젠 AI 300 시리즈 프로세서는 타협 없이 완벽한 AI PC 솔루션입니다. 호환성, 다양한 폼팩터, 코파일럿과 써드파티 AI 지원, 성능, 배터리까지 모두요.
라이젠은 AI 300 시리즈는 다양한 윈도우 앱을 지원하며 다양한 장치로 출시됩니다. 윈도우 앱을 지원하는게 당연한데 무슨 이상한 소리를 하냐고 생각하실 수도 있을텐데요. 그 이유는 아래에서 알게 됩니다.
라이젠 AI 300 시리즈는 슬림, 게이밍, 컨텐츠 제작, 엔터프라이즈, 모바일 워크스테이션 등 다양한 폼펙터로 출시됩니다.
라이젠 AI 300 시리즈의 성능입니다. 이제는 스냅드래곤 X 엘리트가 비교 대상에 추가됐는데요. 오피스와 PC마크 10 등의 성능에서 라이젠 AI 300은 단연 높은 성능을 보여줍니다.
시네벤치나 비디오 인코뎅, 렌더링, 디지털 컨텐츠 제작에서도 압도적인 성능을 보여줍니다.
게임의 경우 원래 AMD가 뛰어난 분야였죠? 스냅드래곤 X 엘리트의 그래프가 비어있는 곳이 있는데, 그건 호환성 문제 때문에 실행에 실패해서 그런 겁니다. 위에서 왜 앱 호환성을 강조했는지, 이제는 그 이유를 아실 겁니다.
라이젠 AI 300 시리즈에 탑재된 라데온 890M으로 고스트 오브 쓰시마를 비롯한 AAA 게임을 플레이하는 영상입니다. FSR과 AFMF 프레임 생성 같은 기능까지 동원한 결과긴지만, 화면 끊김 없이 부드러운 게임 그래픽을 볼 수 있었습니다.
마이크로소프트와의 협업을 강조했습니다. 코파일럿+PC를 퀄컴이 가장 먼저 발표했다고는 하나, Xbox 콘솔 게임부터 차근차근 쌓아 온 끈끈한 관계와는 연식이 다르죠.
코파일럿+의 다양한 기능들을 당연히 지원하고요.
써드파티 회사들의 AI 앱 역시 지원합니다.
라이젠 AI 300 시리즈가 탑재된 ASUS 젠북 S16에서 터치펜으로 개발새발 그림을 그리면 스테이블 디퓨전 앱인 Amuse ai가 그럴싸한 이미지로 바꿔주는 데모입니다.
다음은 AI를 실행하는 XDNA2 아키텍처에 대해 봅시다. AMD AI 그룹의 수석 부사장인 Vamsi Boppana가 설명했습니다.
CPU나 GPU로도 AI를 처리할 수는 있지만, AI 부하가 커질수록 NPU가 유리하고 처리 효율도 NPU가 훨씬 높습니다.
더 높은 성능과 처리 효율, 이것이 NPU를 추가하는 이유입니다.
라이젠 AI 시리즈는 세계 최초로 NPU가 내장된 x86 프로세서입니다.
라이젠 AI 300 시리즈의 다이 배치도입니다. 최대 12코어 24스레드의 젠5 CPU, 최대 16CU의 RDNA 3.5 GPU, 그리고 50 TOPS의 성능을 내는 XDNA2 NPU가 있습니다.
기존의 멀티코어 CPU와 XDNA AI 엔진의 구조 차이입니다.
AI의 연산에 최적화된 구조 덕분에 데이터 처리와 접긍 모두 뛰어납니다.
XDNA2 아키텍처에서는 AI 타일 엔진을 늘리고 타일마다 2개의 MAC를 넣는 등의 개선을 통해 성능을 50 TOPS로 높였습니다.
덕분에 연산 용량과 전력 효율이 모두 크게 개선됐습니다.
AMD가 적극적으로 어필하는 기능 중 하나가 블럭 FP16의 지원입니다. 8비트 정수는 성능이 뛰어나고 16비트 부동소수점은 정확도가 높은데, 이 둘의 장점을 가져와 높은 성능과 높은 정확도를 모두 달성하겠다는 것이 블럭 FP16입니다.
그래프로 보면 이렇습니다.
3세대 라이젠 AI 프로세서의 FP16 성능은 50TOPS입니다. 현재 나온 모바일 프로세서 중 가장 높습니다.
그 외에 스테이블 디퓨전 XL 터보를 지원하고
LLM을 다루는 성능 역시 뛰어납니다.
얼마 전에 AMD가 소프트웨어 회사가 되어간다는 글을 올렸었는요. 소프트웨어 최적화 작업 역시 당연히 계속 진행 중입니다.
여러 AI 소프트웨어를 통합해서 다루는 환경을 제공합니다.
AI의 사용은 갈수록 늘어나고 있으며, AMD는 이것이야말로 앞으로 PC 진화의 핵심이라 보고 있습니다.
이제 현장에 전시된 제품들을 소개할 차례입니다.

정말 다양한 노트북이 전시됐고, 모든 제품들이 AI 앱을 실행하고 있었습니다. 여러 제품 중에서 이걸 가장 먼저 올린 건 MSI 노트북이라서 그런 게 맞습니다.

써드파티 앱에서 AMD XDNA를 활용한 가속 처리를 지원합니다.

ASUS 관계자가 와서 시연했을 정도니 ASUS 제품들도 당연히 많았고요.

이것도 AI로 만든 이미지입니다. 수묵화 느낌의 건담이네요.
라이젠 AI 300 시리즈가 탑재된 MSI 프리스티지 노트북이고요. 사진 왼쪽에 카메라 들고 있는 사람이 접니다.
벤치마크를 몰래 돌릴 순 없었지만 이것 하나는 확인할 수 있었습니다. 작업관리자에서 라이젠 AI 300 시리즈를 인식하고.
이제는 윈도우 11의 작업관리자에서 AMD의 NPU를 제대로 보여줍니다.
라이젠 AI 300 시리즈 프로세서의 내장 그래픽으로 폴아웃을 실행하는 데모입니다. 직접 해봤는데 프레임이 떨어진다는 느낌은 전혀 없더라고요.
AMD 데스크탑입니다.

예쁜 튜닝 시스템을 보라고 전시해 둔 건 아니고요.


라이젠 9000 시리즈가 돌아가는 걸 감상하라고 전시한 것입니다.
그리고 여기 귀한 사진이 있습니다. 라이젠 9000 시리즈와 라이젠 AI 300 시리즈의 실물인데요.

평범한 다이와(사진 오른쪽 아래) 표면을 특수 처리해 아키텍처를 직접 볼 수 있는 다이(왼쪽과 오른쪽 위)를 함께 전시했더라고요.

라이젠 9 9950X입니다.
소켓은 당연히 AM5

두께는 뭐 다 같고요.
확대해서 큰 사진으로 보시라고 리사이즈 안 하고 올립니다.
라이젠 AI 300입니다. 이것도 리사이즈 안 하고 올리니까 큰 이미지로 보세요.
모바일 프로세답게 조금 얇네요.
한켠에선 라이젠 9000 시리즈의 오버클럭도 시연했습니다. DD5 6000 메모리에 PBO를 바로 설정하고, 커브 옵티마이저와 커브 쉐이퍼를 켜고 8000MHz 메모리를 사용하는 것, 그리고 액체 질소 쿨링입니다.
PBO와 EXPO를 사용해 쉽고 빠르게 오버클럭이 가능합니다. 여기까지는 기존 제품에서도 지원했던 것이고요.
커브 세이퍼는 더욱 정밀하게 CPU의 커브 값을 조절할 수 있습니다.
메인보드 바이오스 메뉴에서-
AMD 오버클러킹을 선택하고 PBO 메뉴에 들어가면-

커브 세이퍼가 추가됐는데요.

여기에서 저/중/고클럭과 저/중/고온에서 어떻게 작동할 것인지를 지정합니다. 현장에서는 이걸 하나하나 일일이 바꾼 건 아니고 미리 정해둔 값을 불러와서 테스트했습니다.

커브 쉐이퍼까지 쓰면 라이젠 9 9950X가 시네벤치 R23에서 45303점이 나오는군요.
그럼 여기에 액체 질소를 부어봅시다.

저걸 다 쓰는 건 아니겠죠?

보온병의 애슬론 로고를 보니 역사와 전통이 있는 제품임에 틀림 없습니다.
액체 질소를 부어가며 계속해서 테스트를 진행하니-
53557점이 나왔습니다. 기존의 세네벤치 R23 세계 기록을 깬 것이죠. 이것 말고 wPrime과 시네벤치 R15도 세계 기록을 깨는 광경을 직접 볼 수 있었습니다.
<저작권자(c) 기글하드웨어(https://gigglehd.com) 무단전재-재배포금지>
기글하드웨어 인기글
주간뉴스 7/14 - 차세대 CPU 성능, AMD 소프트웨어, 인텔 안정성 문제, 폴드6/플립6/버즈3/링/워치7/워치 ... |
Wi-Fi를 보안 시스템으로 사용하는 제품 |
MSI 노트북 20주년 기념 피규어 |
겜트북의 근본은 뭐다? 고성능. MSI 크로스헤어 17 HX D14VGKG-i9 QHD |