AMD는 RDNA4 아키텍처를 도입한 그래픽카드인 라데온 RX 9000 시리즈를 발표했습니다.
모델 |
컴퓨팅 유닛 |
GDDR6 메모리 |
게임 클럭 (GHz) |
부스트 클럭 (GHz) |
메모리 인터페이스 |
인피니티 캐시 |
TBP |
권장 소비자 가격 (USD) |
AMD 라데온 RX 9070 XT
|
64 |
16 GB |
2.4 |
Up to 3.0 |
256-bit |
64 MB |
304W |
$599 |
AMD 라데온 RX 9070 |
56 |
16 GB |
2.1 |
Up to 2.5 |
256-bit |
64 MB |
220W |
$549 |
가장 중요한거 가장 앞에 박고 시작하겠습니다. 라데온 RX 9070 XT 599달러, 라데온 RX 9070 549달러입니다.
AMD 그래픽 이야기를 할 때면 항상 가장 먼저 나오는 것이 이거죠. PC, 콘솔, 모바일, 휴대용 게임기까지 시장이 넓다는 겁니다.
게이머가 원하는 것이 무엇인지 초점을 맞췄다고 강조합니다. 유출되서 유명세를 탔던 저 '85%의 게이머가 700달러 이하의 GPU를 산다'는 말도 있고요. 갈수록 더 많은 게이머들이 고해상도와 레이 트레이싱을 포함한 고성능을 요구하고, 8핀 보조전원을 사용하는 쉬운 업그레이드를 원한다고 주장합니다.
AMD RDNA4 아키텍처는 고급 게이밍을 더 많은 게이머에게, 그리고 레이 트레이싱과 머신 러닝 성능을 향상시켰고, 가성비를 개선했다고 강조합니다.
RDNA4 아키텍처는 새로운 컴퓨트 유닛을 사용합니다. 기존의 RDNA3와 비교하면 메모리 서브시스템, 스칼라 유닛, 다이나믹 레지스터 할당, CU 효율과 클럭 속도가 향상됐다고 합니다.
RDNA4 아키텍처는 3세대 레이 트레이싱 가속기가 탑재됩니다. CU당 레이 트레이싱 출력이 2배로 개선됐습니다.
또 2세대 AI 가속기가 탑재됩니다. FP16은 2배, INT8은 4배로 개선되고 FP8 포맷을 새로 지원합니다.
그리고 미디어 엔진을 개선해 전 세대보다 20% 높은 미디어 품질을 제공하며, PCIe 5.0, HDMI 2.1b, DP 2.1a 등의 최신 규격을 지원합니다.
그 RDNA4 아키텍처를 처음으로 쓴 그래픽카드가 라데온 RX 9070 시리즈입니다.
라데온 RX 9070 시리즈는 4k 해상도 게임을 1440p 급의 그래픽카드에서 실현한다고 주장합니다.
라데온 RX 9070 시리즈의 주요 스펙입니다.
라데온 RX 9070은 4K 해상도에서 라데온 RX 6800 XT보다 38%, 지포스 RTX 3080보다 26% 빠르다고 합니다.
라데온 RX 9070와 라데온 RX 7900 GRE의 4K 울트라 설정 성능 비교입니다. 21% 빠릅니다.
라데온 RX 9070와 라데온 RX 7900 GRE의 1440pK 울트라 설정 성능 비교입니다. 20% 빠릅니다.
라데온 RX 9070 XT는 4K 풀옵에서 라데온 RX 6900 XT보다 51%, 지포스 RTX 3090보다는 26% 빠릅니다.
라데온 RX 9070 XT와 라데온 RX GRE의 4K 울트라 설정 성능 비교입니다. 42% 빠릅니다.
라데온 RX 9070 XT와 라데온 RX GRE의 1440p 울트라 설정 성능 비교입니다. 38% 빠릅니다.
이제 소프트웨어 차례입니다.
AMD HYPR-RX 최적화를 1000개가 넘는 게임에서 지원하며, 올해는 AFMF 2.1을 비롯해 새로운 기능이 추가될 예정입니다.
HYPR-RX의 효과. 초해상과 프레임 생성을 조합해 2배가 훨씬 넘는 프레임 향상을 이끌어냅니다.
FSR4가 발표됐습니다. RDNA4 아키텍처 그래픽카드에서 지원하며 높은 품질과 낮은 레이턴시를 제공하고, 기존 FSR 3.1 지원 게임에서 쉽게 업그레이드 가능합니다. 또 뉴럴 렌더링을 지원합니다.
FSR4의 효과. 프레임 향상이야 기존 버전에서도 제법 높았으니 이건 뭐 특별할 게 없고.
FSR 3.1보다 FSR4의 그래픽이 더 뛰어나다는 걸 알 수 있습니다.
FSR4는 출시에 맞춰서 30개 이상의 게임에서 지원하며, 올해 안에 75개 이상의 게임에서 지원할 예정입니다.
FSR4와 HYPR-RX의 효과
그 외에 AI 최적화된 테스트를 도입해 안정성 개선, AI 내장 보고 도구, AMD 챗 등을 비롯해 AI를 적극적으로 활용합니다.
미디어 엔진도 개선됐습니다. H.264, HEVC, AV1을 지원하며 최대 8K 80fps의 인코딩/디코딩이 가능하고, 세션과 인코딩 스트림의 제한도 없습니다. NVIDIA는 5개로 제한하는 것으로 알고 있습니다. https://gigglehd.com/gg/13969787
전 세대와 비교하면 AI 성능도 크게 올랐습니다.
AI 가속을 위한 최적화도 제공합니다.
AMD에 최적하된 모델과 ONNX 런타임 확장을 제공할 예정입니다.
RDNA4 아키텍처를 쓴 라데온 RX 9000 시리즈, FSR4와 ML 기반 업스케일링, 새로운 AMD 소프트웨어를 소개했습니다.
라데온 RX 9070 시리즈는 3월 6일에 출시됩니다. 중국 쪽에서 가격이 공개됐다고 사진들이 올라왔었는데요. 내부 브리핑을 진행했을 때는 정확한 가격을 공개하지 않았지만, 정식 발표에 맞춰서 라데온 RX 9070 XT 599달러, 라데온 RX 9070 549달러로 발표했습니다.
나비4 아키텍처 딥다이브
지금까지는 전체 내용을 모아서 요약한 자료였고, 더 깊은 내용도 공유해 드립니다. 우선 RDNA4 아키텍처입니다.
CU당 성능이 꾸준히 오르고 있습니다. 라스터와 레이 트레이싱은 물론, 머신 러닝의 성능 향상폭이 매우 큽니다.
RDNA4 아키텍처를 쓴 라데온 RX 9070 XT의 다이 구조도입니다. 3세대 레이 트레이싱 가속, 3세대 매트릭스 가속 등에서 구체적으로 어떤 개선이 있었는지를 소개하고 있고요. 캐시 최적화와 새로운 듀얼 미디어 엔진 도입, 디스플레이 엔진에 대해서도 설명하고 있습니다. 전 세대의 칩렛이 아직 컨슈머용 그래픽으로는 쓰기 어렵다고 판단했나 이번에는 TSMC 4nm 공정의 모놀리식 싱글 다이가 됐습니다.
RDNA4는 H.264와 HEVC 인코딩 처리가 향상되고 AV1 인코딩의 B프레임 처리 효율도 올랐습니다. 또 AV1과 VP9에서 50% 높은 성능을 보여줍니다.
디스플레이의 경우 듀얼 모니터 구성에서 아이들 파워를 줄였고(마참내!) 비디오 프레임 스케줄을 GPU가 처리하면서 영상 재생 시 CPU 전력을 낮춰줍니다.
컴퓨트 엔진의 구성입니다. 기본적으로는 듀얼 SIMC32 벡터 유닛(각각 FMA 전용과 FMA/INT 겸용)과 8개의 TLU가 있고, AI 가속기와 레이 가속기 등에 신경을 많이 썼음을 알 수 있습니다.
현대적인 그래픽 요구에 맞춰서 레이 트레이싱과 AI 연산을 강화했습니다. 깡성능인 라스터라이즈 성능만을 따지는 시대는 이제 지나갔지요.
RDNA4의 레이트레이싱 아키텍처입니다. 박스당 8레이, 삼각형 유닛당 2레이로 전 세대보다 2배 개선됐고 개선된 BVH 구조로 차지하는 용량을 줄였습니다.
OBB 도입의 효과. 히트맨만 봐도 박스를 좀 더 타이트하게 잡음으로서 효율이 높아졌음을 알 수 있습니다.
RDNA4에서는 아웃 오브 오더 퀴리를 메모리에 날릴 수 있습니다. 그래서 더욱 효율적인 시간 활용이 가능합니다.
RDNA4의 광선 이동 아키텍처. BVH8, BVH 압축, 아웃 오브 오더 메모리 등등을 도입해서 성능을 높였습니다.
RDNA4의 쉐이더입니다. 레지스터를 동적으로 정리해서 더욱 효율적인 활용이 가능합니다.
RDNA4의 AI 처리입니다. fp16부터 int4까지 처리 ops가 늘었고, fp8과 bf8 포맷도 지원합니다.
그래서 RDNA4는 CU당 처리 성능이 전 세대보다 더욱 높아졌습니다.
FSR4입니다. 머신 러닝 기반 초해상 기술입니다.
FSR4와 FSR4+프레임 생성의 효과
레이트레이싱과 패스트레이싱의 비교. 패스트레이싱의 효과가 더욱 좋지만 부담이 훨씬 큽니다.
RDNA4의 패스 트레이싱 처리. 1샘플딩 픽셀만 표시했을 경우.
이제 라이트 그리드 샘플링과 뉴럴 래디언스 캐싱을 더해주고
글로벌 일루미네이션에
뉴럴 슈퍼샘플링과 노이즈 제거를 거치면 이런 결과가 나옵니다.
RDNA4의 변경점 정리.
FSR과 HYPR-RX 업데이트
이제 소프트웨어적인 변경점을 봅시다.
FSR은 지원하는 게임을 무섭게 늘려 나가고 있습니다.
FSR의 역사. 처음에는 공간 업스케일링으로 시작해서 FSR3에서는 시간 업스케일링으로, 그 다음에는 프레임 생성을 추가하고 품질을 향상시켰습니다.
FSR4입니다. RDNA4 아키텍처 그래픽카드에서 지원하며 높은 품질과 낮은 레이턴시, 그리고 FSR 3.1 APU에서 쉬운 업그레이드가 가능하고 뉴럴 렌더링을 지원합니다.
FSR4는 머신 러닝을 사용해서 알고리즘을 학습했습니다.
넓은 분야를 다 다루는 회사답게 온갖 제품이 다 나오는군요. 생각해보니 AMD가 인스팅트가 아닌 NVIDIA 카드로 훈련시켰을리도 없겠고요.
화질 비교입니다. 위에서도 간단한 버전이 나왔는데 여기에선 한 장이 더 추가됐네요. FSR3.1보다 더 나은 화질을 보여줍니다.
또 다른 화질 비교입니다. 네이티브만큼은 아니지만 FSR3.1의 균형 모드와 비교해도 FSR4의 성능 모드가 더 선명한 화질을 보여줍니다.
FSR4를 적용 시 3.5배의 프레임 향상 효과가 있습니다.
스페이스 마린 2 외에 다른 게임에서의 성능 향상 비교입니다.
FSR4는 출시와 함께 30종 이상의 게임을 지원하며, 올해 안에 75종의 게임에서 지원할 예정입니다.
HYPR-RX입니다. 클릭 하나로 AMD의 모든 최적화 기능들을 자동으로 적용해 줍니다.
플루이드 모션 프레임, 줄여서 AFMF는 2.1 버전으로 업데이트됩니다. 고스팅을 줄이고 더 나은 시간 추적을 통해 이미지 품질을 높여줍니다.
AFMF 2와 2.1의 비교. 고스팅 현상 감소 하나만 봐도 업그레이드됐다는 티가 팍팍 납니다.
AFMF 2.1의 프레임 향상 효과.
이런 초해상/프레임 생성 기능의 처리 과정이 추가되면서 레이턴시가 늘어가게 되다보니, 이를 줄여주는 기능은 꼭 함께 따라붙게 되는데요. 그래서 안티랙 2가 있습니다.
2023년과 비교하면 올해 더 큰 폭의 성능 향상을 제공하며, 앞으로 다른 기능도 나올 예정입니다.
AMD 소프트웨어 아드레날린 에디션 25.3.1
마지막으로 새로운 버전의 드라이버입니다.
AI를 활용해 디자인, 간소화, 강력한 성능을 제공합니다.
라데온 이미지 샤프닝 2입니다. 더욱 선명한 효과를 제공하며 게임이나 영상, 데스크탑에서 버튼 하나로 적용 가능합니다.
인코더를 새로 설계했습니다. 비교짤만 봐도 화질 차이가 느껴지는군요. 라데온 RX 9000 시리즈에만 해당됩니다.
AI 툴들이 보강됐습니다. AI 앱을 관리하고, 로컬에서 AI 챗을 실행하고 이미지를 다룹니다.
새로운 AI 앱 매니저입니다. 드라이버에 AI라는 탭이 추가됐네요.
AMD 설치 매니저입니다. 다양한 AMD 앱을 관리합니다.
AMD 챗입니다. GPU 가속을 활용해 로컬에서 챗봇을 운용하고 이미지 생성을 할 수 있습니다. 아직까지는 영어와 중국어만 지원합니다.
GPU 가속 모델의 지원.
고레벨 아키텍처인 AMD ROCm의 특징.
중간에 FSR이나 HYPR-RX 관련 내용이 있는데 그건 앞에서 소개했으니 빼고요. 드라이버에 갈수록 많은 기능이 추가되고 있습니다.
게임플레이 테스트를 자동으로 수행하고, 화면 출력 교정과 충돌 감지를 수행해 안정성을 개선합니다.
게임에서 다양한 에러 사례
이걸 자동으로 판단하고요
AMD가 훈련시킨 AI 모델이 게임 플레이 중의 잘못된 화면 표시를 감지하고
이를 보내서 개선할 수 있습니다.
AMD 소프트웨어 아드레날린 에디션 25.3.1에서는 소프트웨어 개발과 운영에 AI를 많이 썼음을 강조합니다.
<저작권자(c) 기글하드웨어(https://gigglehd.com) 무단전재-재배포금지>
기글하드웨어 인기글
충동구매를 부르는 가격. MSI MP242L850 IPS 100 시력보호 |
디자인이 예술이네. 마이크로닉스 WIZMAX 아트리안 |
은근히 고사양인 몬스터 헌터: 와일즈. AMD가 필요한 이유 |
어디서든, 어떻게든 게임 플레이. MSI 클로 8 AI+ A2VM |