게이밍 그래픽카드 시장은 지금 전환점에 서 있다. 고성능 타이틀이 점점 더 높은 그래픽 요구 사양을 제시하는 가운데, 소비자는 가격 대비 성능을 극대화할 수 있는 최적의 선택지를 갈망한다. 하지만 최근 몇 년간 시장을 주도한 것은 엔비디아의 RTX 시리즈다. RTX 50 시리즈가 높은 성능과 AI 기반 기술을 앞세우며 프리미엄 시장을 장악했고, 메인스트림과 퍼포먼스급에서도 RTX 4070, 4070 Ti, 4080 SUPER 등의 제품이 여전히 존재감을 과시한다.
그러나 AMD 역시 시장을 향한 회심의 한 방은 진행형이다.
25년 2월 28일 밤 22시에 전격 공개될(이 원고가 공개되는 기점) RDNA 4 아키텍처 기반의 라데온 RX 9070과 RX 9070 XT가 주인공이다. 그동안 AMD 라데온 시리즈는 경쟁사 대비 가격 대비 성능이 뛰어난 옵션으로 평가받았지만, 고해상도 게이밍과 AI 가속 기능 면에서는 상대적으로 아쉬운 평가가 뒷따랐다. 하지만 AMD의 설명을 빌리자면 이번 RX 9070과 RX 9070 XT는 새로운 아키텍처와 전력 효율 개선, 향상된 레이 트레이싱 성능을 앞세워 퍼포먼스급 시장에서 싸워볼만한 체력을 갖췄다는 것.
덕분에, 1440p 및 4K 해상도에서 안정적인 프레임을 원하는 게이머에게 RX 9070 시리즈는 가장 현실적인 대안으로 구매 리스트에 오를 가능성이 확실시 된 상황. 물론 가격 정책이 '가성비' 라는 전제를 충족했을 때다. 기존에 RTX 5070 Ti, RTX 5080을 고려했던 사용자에게는 AMD가 제시하는 새로운 대안이 먹힐지, 라데온 특유의 메모리 대역폭과 최신 기술 적용이 게임 플레이 경험을 어떻게 변화시킬지 기대를 모으고 있다.
자고로 게이머는 더 이상 단순한 성능 지표만으로 그래픽카드를 선택하지 않는다. 가격, 전력 효율, 최적화된 게임 경험까지 종합적으로 고려하는 흐름 속에서 RX 9070과 RX 9070 XT는 시장의 요구에 부합하는 새로운 옵션으로 부상할 채비를 끝냈다.
Specification | AMD Radeon RX 9070 XT | AMD Radeon RX 9070 |
---|---|---|
Architecture | RDNA™ 4 | RDNA™ 4 |
Manufacturing Process | TSMC N4P | TSMC N4P |
Transistor Count | 53.9 billion | 53.9 billion |
Die Size | 357 mm² | 357 mm² |
Compute Units | 64 | 56 |
Ray Accelerators | 64 | 56 |
AI Accelerators | 128 | 112 |
Stream Processors | 4096 | 3584 |
Game GPU Clock | 2400 MHz | 2070 MHz |
Boost GPU Clock | Up to 2970 MHz | Up to 2520 MHz |
Peak Single Precision Throughput | Up to 48.7 TFLOPS | Up to 36.1 TFLOPS |
Peak Half Precision Throughput | Up to 97.3 TFLOPS | Up to 72.3 TFLOPS |
Peak INT8 AI TOPS Throughput | Up to 779 TOPS w/ Sparsity | Up to 578 TOPS w/ Sparsity |
Peak INT4 AI TOPS Throughput | Up to 1557 TOPS w/ Sparsity | Up to 1156 TOPS w/ Sparsity |
Peak Texture Fill-Rate | Up to 760.3 GT/s | Up to 564.5 GT/s |
ROPs | 128 | 128 |
Peak Pixel Fill-Rate | Up to 380.2 GP/s | Up to 322.6 GP/s |
AMD Infinity Cache™ | 64 MB (3rd Gen.) | 64 MB (3rd Gen.) |
Memory | 16GB GDDR6 | 16GB GDDR6 |
Memory Speed | 20 Gbps | 20 Gbps |
Memory Bus Interface | 256-bit | 256-bit |
PCIe® Interface | PCIe 5.0 x16 | PCIe 5.0 x16 |
Total Board Power | 304 W | 220 W |
◆ 애즈락 Radeon RX 9070 XT 그래픽카드
◆ 애즈락 Radeon RX 9070 그래픽카드
1. RDNA 4에서 달라진 것은?
합리적인 가격대에서 하이엔드 성능을 경험할 수 있게한다는 RDNA 4는 TSMC 4nm 제조 공정에서 총 53.9억 개 트랜지스터를 직접했는데, 주요 핵심은 메모리 처리, 레이 트레이싱 성능, 동적 레지스터 할당 등 세 가지 핵심 요소로 압축할 수 있다.
1-1. 메모리 아키텍처 개선
메모리 요청의 지연(latency)은 그래픽 연산에서 성능을 결정하는 중요한 요소다. 특히 레이 트레이싱 작업에서는 BVH(Bounding Volume Hierarchy) 구조를 탐색하는 과정에서 텍스처 및 버퍼 요청이 빈번하게 발생하며, 이 과정에서 발생하는 메모리 지연이 전체 성능에 큰 영향을 미친다. RDNA 4는 이러한 문제를 해결하기 위해 메모리 요청을 더욱 효율적으로 처리하는 새로운 아웃오브오더(Out-of-Order) 큐를 도입했다. 기존 RDNA 3에서는 메모리 요청이 순차적으로 처리되었지만, RDNA 4에서는 응답이 빠른 데이터는 즉시 반영할 수 있도록 요청을 유연하게 처리하여 지연을 줄였다. 이를 통해 특정 데이터를 기다리느라 전체 프로세스가 멈추는 현상을 방지하고, 보다 빠른 연산 처리가 가능해졌다.
1-2. 레이 트레이싱 성능 강화
RDNA 4의 레이 트레이싱 아키텍처는 기존 RDNA 3 대비 크게 개선되었다. 새로운 레이 가속기(ray accelerator) 디자인을 적용하여, 8개의 Ray/Box 유닛과 2개의 Ray/Triangle 유닛을 탑재해 이전 세대 대비 두 배의 연산 능력을 갖추었다. 또한 전용 하드웨어 인스턴스 변환 및 스택 관리 최적화를 통해 레이 트레이싱 성능을 더욱 향상시켰다. 특히 BVH8(Bounding Volume Hierarchy 8)을 적용하여 레이 트레이싱 시 필요했던 탐색 단계를 줄이고 레이턴시를 낮추는 방식으로 처리 속도를 최적화했다. 새로운 노드 압축 기법을 통해 BVH 메모리 사용량을 줄였고, 불필요한 연산을 최소화하는 Oriented Bounding Boxes(OOB) 기술을 도입해 보다 정확하고 효율적인 광선 추적을 구현했다.
1-3. 동적 레지스터 할당을 통한 연산 효율성 증가
RDNA 4는 레이 트레이싱을 비롯한 여러 복잡한 연산 과정에서 발생하는 레지스터 사용량의 변화를 보다 효과적으로 대응한다. 기존 RDNA 3에서는 쉐이더가 최악의 경우를 대비해 미리 일정한 양의 레지스터를 확보해야 했지만, RDNA 4에서는 필요에 따라 레지스터를 동적으로 할당하는 구조로 변경되었다. 이를 통해 필요할 때만 레지스터를 요청하고, 사용이 끝나면 즉시 반환할 수 있다. 이러한 동적 레지스터 할당 방식은 메모리 점유율을 보다 효과적으로 관리할 수 있게 하며, 동시에 더 많은 연산을 병렬로 수행할 수 있도록 지원한다. 이를 통해 RDNA 4는 보다 높은 점유율(occupancy)로 메모리 지연을 최소화하며, 전반적인 쉐이더 코어의 효율을 극대화하는 결과를 얻었다.
2. 관건은 성능, 쓸만한가?
경쟁사의 특이한 움직임이 목격되면서 다양한 관측을 가능케 했다. 2025년 2월로 예정되었던 RTX 5070의 출시를 3월 5일로 연기하는데, 이에대해 라데온 RX 9070 시리즈를 견제하기 위한 전략이라는 해석에 무게가 실리고 있다. 참고로 RX 9070 XT 가격은 $899 미만이며, 엔비디아 RTX 5070 Ti가 직접적인 경쟁 대상이다.
게다가 AMD는 하이엔드 대신 ‘퍼포먼스급(Performance Tier)’ 이라는 메세지를 드러냈다. 이는 RTX 5090, 5080과 같은 초고성능 시장과의 비교 구도가 형성되는 것을 사전에 차단함과 동시에 4080급 성능을 5070 Ti 가격에 제공한다는 식의 '가성비' 메시지를 포섭하겠다는 의중이다.
경쟁 구도를 형성하는 두 회사 제품은 결정적인 차이점이 있는데, 바로 메모리다.
RX 9070 XT, RX 9070: 16GB GDDR6 (256-bit)
RTX 5070 Ti, RTX 5070: 16GB GDDR7 (256-bit)
양사 모두 16GB VRAM과 256-bit 버스 인터페이스를 유지하면서 동일한 메모리 대역폭을 제공하지만, NVIDIA는 GDDR7을 도입해 메모리 속도 및 대역폭에서 이점을 포섭하려는 의도가 짙다. GDDR7은 펄스 진폭 변조(PAM3) 방식을 도입해 메모리 전송 속도가 GDDR6 대비 약 30~50%의 개선 효과를 가져간다. 고대역폭을 필요로 하는 레이 트레이싱 및 AI 연산 성능에서 경쟁력을 확보할 수 있다.
이점을 AMD가 모르는 바가 아니다.
RX 9070 시리즈는 GDDR6 기반이므로, RTX 5070 시리즈 대비 메모리 성능에서 약간의 열세가 불가피하다. 그렇지만 AMD가 인피니티 캐시(3세대) 기술을 통해 메모리 효율성을 최적화했다면 실질적인 성능 차이는 줄어들 수 있다. 이는 RTX 5070 시리즈가 GDDR7을 활용하여 메모리 대역폭을 극대화하는 반면, RX 9070 시리즈는 RDNA 4의 효율적인 메모리 압축 및 캐시 최적화를 통해 두 제품간의 간극을 좁힌다는 복안이다.
이와 같은 차이로 인해 메모리 대역폭이 중요한 4K 게이밍 및 AI 연산 환경에서는 RTX 5070 Ti가 RX 9070 XT 대비 성능적 우위를 확보할 가능성이 높다. 하지만 여기에 가격 경쟁력를 추가하면, 전반적인 '체감 + 실질' 효율성 측면에서는 RX 9070 시리즈가 더 유리할 수 있다.
덕분에 고해상도(4K, 1440p)를 추종하는 게이머와 크리에이터의 시선에 "엔비디아 대비 가성비 높은 그래픽카드"라는 이미지가 제법 설득력있게 먹힐 전망이다. 참고로 RX 9070 XT는 RTX 5070 Ti보다 저렴한 가격을 책정해 가성비 우위를 점하는 전략을 RX 9070은 RTX 5070과 같은 가격대에서 VRAM과 성능 우위를 확보하는 전략이 유력하다. 물론 본 글은 제출 출시 전에 작성된 것인만큼 아직까지는 뇌피셜이다.
◆ 테스트 환경
① CPU - AMD 라이젠7-5세대 7800X3D
② M/B - ASRock X870E TAICHI
③ RAM - 마이크론 Crucial DDR5-6000 CL36 PRO Overclocking
④ SSD - 마이크론 Crucial P310 M.2 NVMe 2TB 대원씨티에스 NVMe SSD
⑤ VGA - option
⑥ 쿨러 - TRYX PANORAMA 3D SE 360 ARGB 수냉 쿨러
⑦ 파워 - 마이크로닉스 Classic II 1050W ATX3.1 화이트
⑧ OS - Windows 11 Pro 23H2, Adrenalin Edition 23.5.1
** 편집자 주
"확실히 좋아진 라데온 RX 9070 & RX 9070 XT, 더는 의심하지 말 것"
이미 제품이 좋다는 건 확실시 된 상황. 제품이 좋으니 한 번 더 복기하겠다.
라데온 RX 9070 & RX 9070 XT에 적용한 핵심 아키텍쳐 RDNA4는 3세대 레이 트레이싱 가속기와 3세대 매트릭스 연산 엔진의 도입으로 RDNA 3와 비교해 레이 교차 속도가 두 배 향상되었으며, 8-Wide BVH(바운딩 볼륨 계층) 압축과 레이 트래버설 최적화가 적용되어 실시간 레이 트레이싱 성능이 더욱 강화되었다. 또한 새로운 ML 기반 슈퍼 해상도 기능이 추가되면서 AI 업스케일링 성능도 개선되었다.
메모리 및 캐시 시스템도 대폭 개선되었다. 64MB의 3세대 인피니티 캐시, 8MB의 L2 캐시, 그리고 2MB의 CU(컴퓨트 유닛) 캐시를 적용해, 데이터 접근 속도를 향상시키고 GPU의 메모리 대역폭 효율을 극대화했다. 여기에 최대 256bit 인터페이스의 20Gbps GDDR6 메모리를 지원하여 높은 대역폭과 함께 더욱 빠른 메모리 압축 성능을 제공한다. 이를 통해 4K 게이밍에서도 안정적인 프레임을 유지한다.
연산 엔진도 큰 변화를 보였다. 듀얼 SIMD32 벡터 유닛과 확장된 매트릭스 연산 지원을 통해 AI 기반 처리를 가속화하며, 새로운 8비트 플로트 데이터 타입을 지원해 AI 및 머신러닝 연산에서의 효율성을 높였다. 스케줄러와 명령어 처리 엔진도 개선되어 보다 효율적인 병렬 연산이 가능해졌고, 연산 명령어의 사전 패치(prefetch) 최적화를 통해 병목 현상을 줄였다.
미디어 처리 성능에서도 의미 있는 발전이 있었다. 새로운 듀얼 미디어 엔진을 도입하여 인코딩과 디코딩 성능이 강화되었으며, 특히 H.264와 H.265 인코딩 품질이 최대 25% 향상되었다. AV1 인코딩 성능 또한 개선되어, 실시간 게임 스트리밍과 고해상도 영상 편집에 더욱 적합해졌다. 이와 함께, VCN(Video Core Next) 저전력 비디오 재생 엔진의 효율이 50% 이상 향상되어, 저전력 환경에서도 더욱 원활한 영상 처리 기능을 제공한다.
디스플레이 처리 엔진 역시 향상되었다. RDNA 4는 DisplayPort 2.1a와 HDMI 2.1b를 지원하며, 업데이트된 스케일링 및 샤프닝 엔진이 포함되어 있다. Radeon Image Sharpening 2(RIS2)가 적용되어 모든 API에서 일관된 화질 향상을 제공하며, 하드웨어 기반 프리싱크 최적화를 통해 멀티 디스플레이 환경에서도 전력 소비를 줄였다.
열거한 기술적 진화는 RX 9070 및 RX 9070 XT가 4K 게이밍을 목표로 설계된 하이엔드 GPU임을 의미한다. 레이 트레이싱 성능이 대폭 개선되었고, AI 기반 연산 능력이 강화되었으며, 대용량 캐시와 높은 메모리 대역폭을 갖춘 만큼, 최신 AAA 게임에서도 우수한 성능을 무난히 뽑아낸다. 덕분에 게이머로 하여금 엔비디아 RTX 5070Ti의 대안으로 RX 9070 시리즈를 저울질하게 만든다.
시장 반응을 살펴보면, 엔비디아 RTX 5070Ti 그리고 RTX 5080 사이 포지션을 전략적으로 노린 RX 9070 XT가 특히 관심대상이다. 하드웨어적으로 전력 효율성과 성능 최적화를 달성하면서도 700달러 이하의 가격대를 유지할 거라는 기대가 매력적인 요소로 작용한 만큼, 그동안 엔비디아가 독점하다시피 했던 퍼포먼스급 하이엔드 GPU 시장에서 AMD가 존재감을 확장하는 계기가 될 거라는 관측에도 힘이 실렸다.
하지만 단순히 가격과 성능만으로 시장이 움직이는 것은 아니다. 드라이버 최적화와 게임 호환성, 실사용자의 피드백이 출시 이후의 최종적인 평가를 좌우할 중요한 요소다. AMD가 지속적으로 개선해 온 소프트웨어 지원과 최적화가 RDNA 4에서도 안정적으로 이어질 수 있을지가 향후 시장 점유율을 결정하는 핵심 변수가 될 전망이다.
결과적으로 RX 9070 시리즈는 AMD가 게이머에게 던지는 또 하나의 강력한 메시지다. 더 이상 퍼포먼스급 그래픽카드 시장이 한 방향으로만 흐르지 않으며, 가격 대비 성능을 고려한 실질적인 선택지가 존재한다는 점을 증명하고 있다. RX 9070과 RX 9070 XT가 실사용 환경에서 어느 정도의 경쟁력을 확보할 수 있을지는 본격적으로 판매가 이뤄지면 실 사용자가 게임을 통해 체감할 성능과 더불어 누적될 시장 반응을 거듭하며 더욱 명확해질 것이다.
By 김현동 에디터 Hyundong.kim@weeklypost.kr
〈저작권자ⓒ 위클리포스트, 무단전재 및 재배포 금지〉