단순히 화면에 색깔을 입혀주던 용도로 쓰이던 등장했던 그래픽 카드의 변신이 놀랍다.
3D 가속 기능과 동영상 가속 기능을 탑재하더니, 수천개 코어의 병렬연산의 장점을 살려 실제와 같은 영화 장면을 그리거나 3D 랜더링 속도를 가속화하고, 첨단 기술인 AI 산업 역군으로 일하고 있다.
당연히 컨텐츠 소비자와 생산자 입장에서 필요한 기능이 다른 만큼 그래픽 카드 제조사들은 각 타겟층을 겨냥해 독특한 제품들을 내놓고 있는데, 이번 기사에서 다룰 AMD의 라데온 프로(Radeon Pro) W7900도 이런 제품 중 하나다.
같은 RDNA3 아키텍처, 라데온 프로 W7000 시리즈와 라데온 RX 7000 차이는?
AMD 라데온 프로 W7900이 포함된 라데온 프로 W79000 시리즈는 AMD가 VR, 3D 모델링 등의 컨텐츠 크리에이터를 위해 만든 전문가용 그래픽 카드다.
최신 게임에서 대용량 VRAM의 중요성이 대두되고 있지만, '소비자' 입장에서는 적절히 타협할 수 있는 반면, 어느 수준까지 타협할지 결정하기 위해서라도 타협할 수 없는 원본을 만들어내는 창작자를 위해 훨씬 많은 VRAM을 탑재한 것이 '라데온 프로'에서 가장 먼저 눈에 띄는 특징이다.
라데온 프로 W7000 시리즈는 제품명에서 유추되듯, 지난해 출시된 라데온 RX 7000 시리즈와 같은 RDNA3 아키텍처와 칩렛 구성을 이어받은 제품이다. 워크스테이션용 모델인 만큼 대용량 VRAM을 탑재한 것이 가장 먼저 눈에 띄는 특정이다.
이번 기사의 주인공인 라데온 프로 W7900의 VRAM은 무려 48GB 용량으로, 라데온 RX 7000 시리즈의 플래그십 모델인 라데온 RX 7900 XTX에 비하면 두 배, 메인스트림급인 라데온 RX 7600 보다는 무려 여섯 배나 많은 VRAM이 탑재되었다.
대량의 데이터 처리 과정에서 발생할 수 있는 데이터 오염을 자체 수정하기 ECC 메모리가 탑재되었다.
라데온 RX 7000 시리즈와의 또 다른 차이점은 DP 2.1 포트 지원이다. 라데온 RX 7000 시리즈 역시 DP 2.1을 지원하지만 실제 대역폭은 최대 규격에 못미치는 54Gbps(UHBR13.5, 유효 대역폭 52.22Gbps)에 그치는 반면 라데온 프로 W7000 시리즈는 DP 2.1 규격의 전체 대역폭인 80Gbps(UHBR 20, 유효 대역폭 77.4Gbps)을 지원한다.
이는 더 높은 해상도화면에서도 압축없이 정확한 색상을 표시해줄 수 있다는 뜻이다. 라데온 프로 W7000 시리즈는 압축 기술(dsc)없이도 8K 60Hz HDR 표현이 가능해, 정확한 색표현에 민감한 창작자들의 고민을 덜어줄 수 있다.
전세대 동급 모델인 라데온 프로 W6800과 비교하면 메모리 용량은 50%나 많아졌고, DP2.1을 도입해 디스플레이 대역폭을 세 배 늘렸으며, AMD의 발표에 따르면 전반적으로 50%의 추가 성능을 기대할 수 있다.
라데온 프로 W7900에 사용된 GPU는 라데온 RX 7900 XTX와 동일한 RDNA3 아키텍처가 쓰였다. 게다가 96CU 기반의 6144 스트림 프로세서와 96MB 인피니티 캐시 등 기본적인 구성도 동일하다.
, 384bit 메모리 인터페이스를 갖췄다. 하지만 안정성이 우선되는 '작업'용 그래픽 카드 특성 때문인 듯, VRAM 대역폭은 960GB/s서 864GB/s로 낮아졌고, FP16 연산 성능은 최대 123TFLOPS서 122.64TFLOPS로, TGP는 355W서 295W로 줄었다.
라데온 프로 W7900, 워크스테이션 사용을 고려한 디자인
라데온 프로 W7900은 게이머를 우선 타겟층으로 삼는 라데온 RX 시리즈와 달리, 작업 효율을 중시하는 워크스테이션용 모델인 만큼 인접한 그래픽 카드와 간섭을 최소화할 수 있도록, 블로워팬 기반의 전통적인 '벽돌' 디자인이 적용되었다.
제품 두께는 라데온 RX 7900 XTX와 같이 2.5 슬롯이지만 시스템에 안정적으로 고정될 수 있도록 3슬롯 브라켓이 사용되었고, 출력 포트도 모두 DP2.1 규격의 표준형 DP 포트3개와 미니DP 포트 1개로 구성된다.
라데온 프로 W7900은 모니터등의 디스플레이 장비 연결을 위한 DP 포트는 PCB쪽에 1열로 배치하고, 쿨러의 배기구 쪽은 블로워 팬으로 내부 열을 빠르게 배출할 수 있도록, 변형을 위한 최소한의 구조를 제외하고 시원하게 뚫어 놓은 모습을 볼 수 있다.
보조전원커넥터는 듀얼 8핀구성으로, 제품 사용을 위한 권장 출력 650W 이상인 파워서플라이라면 특별히 호환성을 걱정하지 않고 사용할 수 있다. 한편, PCB 주변을 둘러싼 철제 프레임에는 추가적인 VGA 지지대나 냉각팬등의 악세서리 고정을 위한 나사홀이 배치되어 있으니, 필요할 경우 활용할 수 잇다.
한편, 백플레이트는 전체를 커버하지 않고 GPU와 VRAM 등 일부분만 커버하도록 디자인된 것은 조금 아쉬운 부분으로, 라데온 프로 W7900을 다수 장착하더라도 인접 카드와 최소 0.5 슬롯 수준의 여유 공간을 확보할 수 있는 디자인을 감안할 때, 백플레이트를 부분적으로만 채택한 이유는 짐작하기 어렵다.
라데온 프로 W7900의 작업 성능 확인
라데온 프로 W7900은 랜더링과 게임 개발자등 전문가를 위한 제품이다. 따라서 이번 기사에서는 일반적인 게임 성능보다 이러한 컨텐츠 창작을 위한 프로그램들 위주로 성능을 확인했다. 라데온 프로는 전문 컨텐츠 크리에이터 대상 모델인 만큼 가급적 그에 어울리는 시스템 구축을 추구하였는데, 이에 CPU는 라이젠 9 7950X, 시스템 메모리는 DDR5 3600MHz 16GB*4, OS는 윈도우 11 프로를 사용했다.
참고로 라이젠 7000 시리즈의 공식 최대 메모리 클럭은 DDR5 5200MHz 이지만 이는 듀얼 DIMM 사용 환경까지며, 4개 슬롯(DIMM)을 모두 사용할 때는 그보다 낮은 DDR5 3600MHz이 공식 지원 최대 클럭이다.
라데온 프로 W7900과 GPU 구성이 동일해 비교군으로 선정한 라데온 RX 7900 XTX는 레퍼런스 모델이 아닌 팩토리 오버클럭 모델이라는 점을 결과 확인에 감안하기 바란다.
먼저, 각종 전문 랜더링 프로그램의 뷰포트 실행 성능을 확인할 수 있는 SPECviewperf 2020 v3.1 버전에서의 성능을 확인했다. 아키텍처와 GPU 구성이 동일한 만큼, 전체 8개 테스트 항목 중 클럭이 빠른 라데온 RX 7900 XTX가 더 빠른 성능을 내주는 경우가, 라데온 프로 W7900이 더 빠른 경우가 각 절반씩으로 나타났다.
참고로 AMD 라데온 프로 시리즈는 W6000 제품군 이후부터 뷰포트 화면의 랜더링 해상도를 동적으로 조정하는 뷰포트 부스트(Viewport Boost) 기능을 지원하며, 드라이버가 업데이트되면서 뷰포트 내 이미지 품질을 높여주는 뷰포트 이미지 부스트 기능도 추가되었다.
뷰포트 부스트는 라데온 프로 소프트웨어 엔터프라이즈 에디션 21.Q2 이후의 '라데온 프로'용 드라이버 뿐 아니라 프로그램에서도 지원이 필요한 부분이라 아직은 제한적이지만, 작업 중인 장면을 다양한 각도로 빠르게 확인할 수 있어 작업 효율을 높여주는데 일조할 수 있다.
또한, 모니터의 원래 해상도 이상의 고해상도로 랜더링 후 네이티브 해상도로 맞춰 표현해주는 라데온 프로 이미지 부스트 기술도 지원한다. 게임용 기술인 가상 초고해상도(VSR)의 라데온 프로 버전으로 이해하면 쉽다.
해당 기술은 Full HD에서 QHD 해상도 모니터에서 최대 4K 해상도를 지원하도록 설계된 기술이다. 현재 4K 모니터의 가격이 싸진 만큼 큰 의미가 없다고 볼 수 있지만, 높은 색재현율과 정확도를 갖춘 구형 모니터를 교체하기 어려운 사용자라면 충분히 메리트 있는 기술이다.
진짜 전문가를 위한 유료 프로 버전과 무료 버전으로 나뉜 다빈치 리졸브는, 무료 버전도 전문 프로그램 뺨치는 기능을 제공하며, PugetBenchmark를 통해 시스템의 작업 성능을 쉽게 비교할 수 있다.
이번 테스트는 PugetBenchmark 0.93.1 스탠다드 버전과 다빈치 리졸브 18.1.4 빌드9 버전을 이용해 진행되었다. 종합 성능은 거의 동급으로 측정되었지만, GPU 효과 성능과 4K 미디어 성능은 라데온 RX 7900 XTX가, 퓨전 스코어는 라데온 프로 W7900이 더 좋은 것으로 나타났다.
긱벤치를 통해 GPU 컴퓨팅 성능을 알아봤다. 그래픽 API 쪽인 벌칸은 클럭 차이를 무시할 수 없는 만큼 라데온 RX 7900 XTX가 더 높은 성능을 내준다. 단지, 테스트에 쓰인 라데온 RX 7900 XTX가 팩토리 오버클럭인 점을 감안하면, 성능 차이는 레퍼런스 모델의 경우 라데온 프로 W7900과 거의 차이가 없을 것으로 예상되는 2.5% 수준에 불과하다.
GPGPU 프로그래밍 언어인 OpenCL의 경우 라데온 프로 W7900이 낮은 클럭에도 불구하고 더 좋은 성능을 내준다. 라데온 RX 시리즈의 드라이버는 게임 성능을, 라데온 프로 시리즈는 안정성과 작업 성능을 우선한 분기별 업데이트 정책이 적용된 영향으로 판단된다.
무료 3D CG SW인 블랜더 3.5.0 벤치마크는 클래스룸과 정크샵, 몬스터 새 가지 모델링의 랜더링 성능을 측정하는데, 클래스룸의 경우 클럭이 높은 RX 7900 XTX의 성능이 좋게 나왔지만 정크샵은 프로 W7900이 훨씬 좋은 성능을 내준다. 정확한 이유는 알 수 없지만, 테스트 샘플의 구현 방식 차이가 영향을 끼쳤을 것으로 추정된다.
한편, 언리얼 엔진 5.2.0을 이용해 샘플 프로젝트의 시네마틱 랜더링 시간을 측정했다. 시간(초) 단위인 만큼 낮을수록 더 좋은 성능을 뜻하며, 클럭이 빠른 라데온 RX 7900 XTX의 성능이 더 좋은 것으로 나타났다.
추가 테스트를 계획했던 슬레이 애니메이션 샘플의 경우 라데온 RX 7900 XTX에서는 텍스처 스트리밍 풀 초과 경고 메시지를 띄운 반면, 라데온 프로 W7900은 텍스처 스트리밍 풀 경고 메시지가 나타나지 않았다.
라데온 프로 W7900의 랜더링 성능 자체는 라데온 RX 7900 XTX에 아쉬운 부분이 있지만, 프로젝트가 커질 경우 VRAM의 중요성을 무시할 수 없다는 반증이 될 것이다. 참고로 모든 테스트는 별도의 옵션 조정없이 기본 설정 환경에서 이뤄졌으며, 슬레이 애니메이션 샘플은 랜더링 과정에서 에러가 발생해 정상적으로 테스트를 수행하지 못했다.
등장 초기에 비해 관심은 많이 사그라졌지만 최근 메타 퀘스트 3와 애플 비전 프로가 공개되면서 여전히 VR 시장이 살아있음을 증명하고 있는데, 이러한 VR 컨텐츠 개발 및 체험 성능을 판단하기 위한 VRMark의 하이엔드 시스템용 테스트인 Cyan Roo,과 Blue Room을 테스트했다. 이번에도 체감 성능 자체는 라데온 RX 7900 XTX 쪽이 더 좋게 나왔다.
대규모 컨텐츠 창작자를 위한 합리적 솔루션, AMD 라데온 프로 W7900
라데온 프로 W7900은 일반 소비자용으로 나온 라데온 RX 7900 XTX와 GPU 구성이 동일하다. 여기에 상대적으로 동작 클럭이 낮기 때문에 프로젝트의 규모가 작은 일반적인 작업이라면 라데온 RX 7900 XTX보다 높은 성능을 기대하기 어렵다.
때문에 라데온 프로 W7900은 VRAM 요구량이 높은 대규모 프로젝트나 GPU 컴퓨팅 작업처럼 본격적인 전문 업무를 수행한다면 충분히 '프로'의 이름값을 한다. 게다가 이런 대규모 프로젝트의 경우 발생할 수 있는 데이터 오염을 방지하기 위한 ECC 메모리를 탑재하였다.
진정한 DP 2.1 규격 지원을 통해 보다 사실적인 대형 프로젝트 수행에 적합하고, 아직 SW 지원이 제한적이지만 보다 빠른 작업을 지원하기 위한 뷰포트 부스트 기능도 탑재했다.
이번 기사에서는 샘플 문제로 라데온 프로 W7900의 실질적인 비교군인 라데온 프로 W6000 시리즈 및 엔비디아의 경쟁 제품 성능 비교는 없었지만, AMD의 테스트 결과에 의하면 오토데스크 3DS Max와 마야, 어도비 프리미어 프로와 애프터 이펙트에서 경쟁 제품과 전세대 모델 대비 약 2 배 수준의 가격대 성능비를 자랑한다.
일반 소비자 대상용 그래픽 카드로 부족함을 느끼고 워크스테이션용 그래픽 카드에 눈독을 들이기 시작했다면, 가성비가 뛰어난 라데온 프로 W7000 시리즈를 고려해보는 것도 나쁘지 않을 것이다.
물론 라데온 프로 W7000 시리즈의 가성비가 같은 성격의 제품군 중에서 상대적으로 뛰어나다 해도 최소 2500달러와 4000달러에 달하는 만만치 않은 가격을 자랑하는 만큼, 결정을 내리기 전 충분한 고민과 사전 정보 수집이 있어야할 것이다.
Copyrightⓒ 넥스젠리서치(주) 보드나라 미디어국. www.bodnara.co.kr