쿨엔조이 NVIDIA GeForce RTX 5090 32GB 벤치마크
Tipping Point
PC 그래픽 기술은 CGA(Color Graphics Adapter)로 시작된 초기 단계에서부터 프로그래머블 셰이더, 그리고 현대의 실시간 레이 트레이싱의 등장까지, 수많은 혁신과 도전을 거쳐 단순히 화려한 그래픽을 넘어, 컴퓨터로 구현되는 세계를 보다 현실과 가깝게 재현하는 데 핵심적인 역할을 했습니다.
그러나 반도체 제조 공정의 발전이 나노미터 단위의 물리적 한계에 도달하며, 렌더링 성능을 지속적으로 끌어올리는 것이 점차 어려운 과제가 되었죠. 특히 반도체 레티클 크기의 제한과 그에 따른 양자 터널링 문제는 반도체의 집적도를 올리는 전통적인 방식으로 더 이상 높은 성능을 보장할 수 없게 만들어버렸습니다. 따라서 그래픽을 다루는 각자의 분야에서 저마다의 방법을 시도하며 해결책을 모색하고 있죠.
전통적인 방식으로는 멀리 있는 사물을 낮은 폴리곤으로 렌더링하는 LOD(Level of Detail), VR 영역에서 많이 사용되는 기술 중 하나인 시야의 가장자리를 낮은 해상도로 렌더링하는 포비티드 렌더링(Foveated rendering) 등이 있습니다. 엔비디아는 이런 기존의 방식을 넘어서, 반도체의 물리적 한계를 극복하고자 자사의 가장 뛰어난 분야 중 하나인 AI를 렌더링 프로세스에 직접 개입시키는 접근 방식을 도입했습니다.
DLSS의 등장
레스터라이징 된 이미지를 인공지능으로 후처리 하는 방식은 그래픽 렌더링 분야에서 새로운 가능성을 열었습니다. 전통적으로 고해상도의 화면을 구현하기 위해서는 GPU가 방대한 연산을 처리해야 했으며, 이는 성능 저하와 높은 전력 소비로 이어지는 주요 과제였습니다. 따라서 한계를 극복하기 위해 도입된 DLSS(Deep Learning Super Sampling)는 낮은 해상도로 렌더링 된 이미지를 인공지능 모델을 활용해 빠르게 업스케일링함으로써, 고해상도에 버금가는 품질을 구현할 수 있었습니다.
본격적인 뉴럴 렌더링의 시대
이번에 발표된 GeForce RTX 50 시리즈는 DLSS 기술의 발전을 보여주는 결정체라 할 수 있습니다. 기존의 AI 후처리 방식을 넘어, 그래픽 셰이더 단계에 인공지능을 직접 개입시킴으로써 그래픽 렌더링에 필요한 자원을 효율적으로 활용하고, 시간을 단축하며, 동시에 품질을 극대화할 수 있게 되었습니다. 따라서 이번 GeForce RTX 50 시리즈는 이를 구현하기 위해 하드웨어적으로 많은 변경점이 나타났으며, 이를 기반으로 한 여러 신기술들이 많이 도입되었습니다.
대표적인 변경 사항으로는 4세대 RT 코어의 도입이 있습니다. 개선된 레이 트레이싱 성능과 뉴럴 렌더링 품질을 제공하며, 5세대 텐서 코어는 FP4 연산 기능을 추가해 AI 성능을 이전 대비 2배로 향상시켰습니다.
또한, VRAM 용량은 이전 세대인 GeForce RTX 4090의 24GB에서 크게 늘어난 32GB GDDR7 메모리로 제공되며, 멀티 프레임 생성 기능이 포함된 DLSS 4도 지원됩니다. 여기에 렌더링 작업과 AI 연산을 동시에 가속화하며 GPU 자원을 효율적으로 활용할 수 있도록 돕는 AMP(AI Management Processor)가 포함되었습니다. 마지막으로, 레이 트레이싱과 같은 애플리케이션에서 디테일을 정밀하게 묘사할 수 있도록 돕는 메가 지오메트리 기술도 새롭게 추가되었습니다.
관련 내용은 이전에 업로드 되었던 'NVIDIA Editor's Day in CES 2025' 의 본문에 자세히 설명 되어 있으니 참고 부탁드립니다.
'NVIDIA Editor's Day in CES 2025 보러가기'
본격적인 뉴럴 렌더링의 서막을 열게될 NVIDIA의 GPU, 그 모습과 함께 사용자가 직접 체감할 수 있는 게임성능은 어떤지, DLSS4를 적용한 게임은 어떻게 달라지는지, 다양한 벤치마크를 통해 자세히 살펴보도록 하겠습니다.
NVIDIA GeForce RTX 5090 32GB Founders Edition
AMD Ryzen 7 9800X3D
MSI MPG X870E CARBON WIFI
Phanteks GLACIER ONE 420 D30 (BLACK)
G.SKILL DDR5-6000 CL28 TRIDENT Z5 NEO RGB J 화이트 패키지 (32GB(16Gx2))
Seagate FIRECUDA 530 M.2 NVMe (4TB)
Seasonic PRIME TITANIUM TX-1600 Full Modular ATX 3.0
NVIDIA GeForce RTX 5090 32GB GPU-Z 정보
NVIDIA ICAT을 이용한 DLSS 4와 DLSS 3 화면 품질 비교(Cyberpunk 2077, 좌 - DLSS 4 Transformer 모델 / 우 - DLSS 3)
Cyberpunk 2077에서 DLSS 4(Transformer 모델)과 기존 DLSS 3의 프레임 제네레이션(2x) 화면 품질을 비교해보면, 서로 다른 오브젝트의 모서리 부분이 다수 겹치는 장면에서, DLSS 4가 더욱 깔끔한 마감 처리를 보여주며, 어느 정도 확인할 수 있을 정도의 차이를 만들어 내고 있습니다.
제품 외부 온도 측정: FLIR E30
GeForce RTX 5090 LOAD / 전면, 후면, 측면, 보조전원 커넥터
※ GeForce RTX 5090 Founders Edition의 경우 기존의 서멀페이스트가 아닌 리퀴드 메탈이 도포되어 있어, 제품 분해 후 재조립시 처음의 성능으로 원복하기 힘들다고 판단, 제품 분해 없이 외부 온도를 측정하였습니다.
소음 측정 : 이중 체임버 구조의 무향실 / CIRRUS RESEARCH CR-162B (Class2 타입)
그래픽 카드 단독 소비전력 측정 : 8 Pin (좌) / 12VHPWR & 12V-2x6 (우)
시스템 전체 소비전력 측정 : HPM-100A Wattman
쿨엔조이 NVIDIA GeForce RTX 5090 32GB 벤치마크 정리 및 총평
게임 종합 성능 결과 요약 및 분석
해상도 별 12종 게임을 테스트한 결과를 요약하면 다음과 같습니다.
■ RTX 4090 대비 해상도 별 약 10% ~ 30% 수준의 성능 향상
- FHD 환경에선 전작 대비 약 14% 내외의 수준 향상, 고해상도로 갈수록 격차가 벌어짐
- 완벽에 가까운 UHD 게이밍 환경을 구축할 수 있는 수준에 도달했다.
■ VRAM 스펙 변화로 고해상도에서 강점
- 지난 세대 GeForce RTX 4090 대비 늘어난 VRAM용량과 더불어 GDDR7로 변경되어 메모리의 인터페이스와 대역폭은 물론 처리 속도 까지 큰 변경이 있었음
- 그에 따라 VRAM의 성능에 영향을 많이 받는 고해상도 환경에서 뚜렷한 성능 향상이 나타난 것으로 보임.
- UHD 보다 더 높은 해상도를 요구하는 VR 환경에서도 충분한 성능 향상을 기대해 볼 수 있을 듯.
압도적인 Multi Frame Generation 기능
GeForce RTX 50 시리즈에서 새롭게 지원되는 DLSS 4의 Multi Frame Generation 기능은 놀라운 수준의 프레임 레이트를 선보였습니다. 특히, 새로 추가된 Multi Frame Generation 기능은 기존에 프레임을 2배로 늘려주던 기술을 확장하여 이제는 3배, 4배까지 프레임 생성이 가능하며, 설정에 따라 극도로 높은 프레임 레이트를 구현할 수 있습니다. 이제 4K 수준의 고해상도와 200Hz 이상의 고주사율 조합에서도 제 성능을 안정적으로 발휘할 수 있는 그래픽 카드가 등장했다고 해도 과언이 아닙니다.
2슬롯으로 구현된 RTX 5090
TGP가 575W로 설계된 만큼 기존보다 더 커진 방열판이 탑재될 것이라 예상되었으나, 실제로는 기존 RTX 4090과 동일한 넓이에 2슬롯이라는 얇은 설계가 적용되었습니다. 이는 완전히 재설계된 PCB가 슈라우드 중심부에만 배치될 수 있도록 최적화된 설계 덕분이며, 그에 따라 냉각팬 2개에서 생성된 에어플로우가 PCB의 영향을 받지 않고 방열판을 그대로 통과하여 기존 Founders Edition보다 더 빠르게 그래픽 카드 외부로 배출, 냉각 효율을 크게 향상시켰기 때문으로 보입니다.
또한, 기존의 서멀페이스트 대신 리퀴드 메탈이 적용되어 GPU에서 발생하는 열이 방열판으로 더 빠르고 효율적으로 전달할 수 있도록 변경하여 결과적으로, 내부 열이 그래픽 카드 내부에 머물지 않고 효과적으로 배출될 수 있는 구조를 구현했기 때문에, 얇은 두께의 방열판을 만들 수 있지 않았나 생각됩니다.
GPU 온도 & 소비전력
GPU온도 측정 결과, LOAD 상황에서 73.8℃를 확인할 수 있었습니다. 이전까지의 테스트 환경이 그렇듯, 오픈 테이블 환경에서 진행되어 측정된 온도로, 실제 케이스에 넣고 사용하는 환경에서는 이보다 다소 높은 온도를 보일 수도 있습니다. 따라서 실제 사용을 염두에 두고 있다면 사용 중인 케이스의 방열 환경을 점검해 볼 필요성도 있어 보입니다.
오픈 케이스 환경에서 측정된 결괏값은 GeForce RTX 4090 대비 6℃가량 높은 수준으로 볼 수 있는데, 물리적 크기를 줄이면서도 압도적인 성능을 구현한 설계에서 나타난 자연스러운 결과로 볼 수 있습니다. 아마도 NVIDIA는 과도하게 커져가는 그래픽카드를 보며, 더 작은 폼팩터로도 최상위 성능을 발휘할 수 있는 설계의 가능성과 새로운 기준을 제시한 것이 아닐까 생각됩니다.
2슬롯에 가득 눌러 담은 NVIDIA 기술의 정수
어김없이 연초에 등장한 NVIDIA의 새로운 플래그십 그래픽 카드 GeForce RTX 5090은 일반 소비자용 그래픽 카드 중 세계 최고 수준의 스펙을 자랑합니다. 이전 세대인 GeForce RTX 4090과 동일한 면적을 유지하면서도 두께를 대폭 줄인 2슬롯 폼팩터로 설계되었으며, 전 세대 대비 약 30% 이상의 성능을 제공하는 GPU를 탑재해 양산 및 출시할 수 있는 기술적 진보는 분명히 칭찬받을 만한 성과라 할 수 있습니다.
또한, DLSS 4를 본격적으로 지원하는 첫 번째 그래픽 카드로, 기존에 2배가량 프레임을 증가시켰던 기술에서 더 나아가 3배, 4배까지 프레임 생성률을 선택적으로 활용할 수 있는 멀티 프레임 생성(Multi Frame Generation) 기술과 더불어, 더 정교한 Transformer 모델을 활용해 프레임 품질을 높이는 데 중점을 두고 있으며, 단순히 생성량을 늘리는 것을 넘어 시각적 디테일과 안정성을 개선하여 사용자 경험을 대폭 향상시킬 가능성을 보여주었습니다.
여기에 Blackwell 아키텍처에서 새롭게 도입된 RTX Neural Shaders는 기존 셰이더 구조에 텐서 코어를 통합함으로써 GPU 자원을 보다 효율적으로 활용할 수 있게 되었습니다. 덕분에 피부를 통과하는 광원, 혹은 다양한 물체에 반사되고 굴절되는 빛의 표현, 자연스럽고 효율적인 머리카락 표현 등 기존 렌더링 방식에서 지적되었던 한계를 해결할 여지를 제공하며, 차세대 게임에서 한층 더 사실적이고 몰입감 있는 그래픽을 구현할 중요한 기술로 자리 잡을 것으로 기대됩니다.
한편, MSRP가 $1,999로 책정되었는데, 이는 GeForce RTX 3090 Ti의 MSRP와 동일한 가격이고, GeForce RTX 4090의 MSRP 보단 $500 더 높은 수준입니다. 절대적으로 높은 가격임은 부정할 수 없으나, 하이엔드 유저들에게는 언제나 그랬듯이 가격보다는 성능과 기술력, 플래그십의 상징성이 우선시 되는 만큼, 꾸준히 플래그십 제품을 이용했던 사용자, 혹은 4K 이상의 환경에서 더 높은 성능을 필요로 하는 VR 유저, 콘텐츠 크리에이터와 AI 개발자들에겐 가격만큼의 성능을 충분히 경험할 수 있지 않을까 생각됩니다.
저작권자ⓒ 쿨엔조이 https://coolenjoy.net/ , 무단전재 및 재배포 금지