엔비디아(NVIDIA)는 2025년 1월 20일(월) 오후 서울 강남구 삼성동 코엑스에 위치한 스튜디오 159(Studio 159)에서 국내 미디어 및 인플루언서를 대상으로 2025 엔비디아 RTX AI 데이(2025 NVIDIA RTX AI Day)를 열었다.
이날 엔비디아는 CES 2025에서 게이머와 크리에이터, 개발자를 위해 공개한 차세대 블랙웰(Blackwell) 아키텍처와 이를 기반으로 하는 지포스 RTX 50 시리즈, RTX AI 업데이트에 대한 보다 상세한 내용을 전했다. 제프 옌 엔비디아 APAC 테크 마케팅 디렉터와 션 클리블랜드 엔비디아 지포스 테크 마케팅 디렉터가 진행했다.
제프 옌 엔비디아 APAC 테크 마케팅 디렉터
엔비디아 지포스 RTX 50 시리즈는 블랙웰(Blackwell) 아키텍처를 기반으로 5세대 텐서 코어(5th Gen Tensor Cores)와 4세대 RT 코어(4th Gen RT Cores), 차세대 GDDR7 메모리 도입 등 모든 면에서 업그레이드가 이루어졌다. 새로운 RTX 기술로는 뉴럴 셰이더, 뉴럴 페이스, 메가 지오메트리, DLSS 4가 더해져 더욱 디테일하고 선명하게 표현하면서 부드럽고 더 빠르게 반응하는 게임 플레이 환경을 제공한다.
제프 옌 엔비디아 APAC 테크 마케팅 디렉터는 지포스 RTX 50 시리즈의 향상된 성능을 언급하며 "엔비디아 지포스 RTX 4090은 여전히 시장에서 가장 빠른 GPU지만 1600달러다. 하지만 지포스 RTX 5070은 550달러 수준으로 현실화하면서도 지포스 RTX 4090급 성능을 구현했다."라고 전했다.
션 클리블랜드 엔비디아 지포스 테크 마케팅 디렉터
엔비디아 GeForce RTX 50 시리즈 데스크톱 및 노트북 GPU는 블랙웰(Blackwell) 아키텍처를 기반으로 AI 기반 신경 셰이더, 디지털 휴먼 기술, 지오메트리 및 조명을 포함하여 AI 기반 렌더링 분야에서 향상된 성능을 제공한다. 블랙웰은 RTX 뉴럴 쉐이더(RTX Neural Shaders)를 출시해 소규모 AI 네트워크를 프로그래밍 가능한 셰이더로 가져와 실시간 게임에서 영화 품질의 소재, 조명 등을 향상한다.
엔비디아 RTX 블랙웰(Blackwell) 아키텍처는 향상된 성능은 물론 새로운 뉴럴 쉐이더를 기반으로 AI 워크로드 최적화와 서비스 이용 품질 향상, 메모리 효율화 및 에너지 효율화를 목표로 한다. AI 관리 프로세서(AI Management Processor)로 연산 성능 및 효율을 향상한다.
지포스 RTX 50 시리즈는 개선된 하드웨어와 AI 연산 능력 향상이 더해지면서 성능 향상이 이루어졌다. AI를 활용해 텍스처, 마테리얼을 효과적으로 압축하고 실시간으로 환경 변화를 보여줄 수 있어 더욱 사실적이면서 영화 품질의 그래픽을 구현할 수 있다. RT 코어는 10배에서 100배 빠른 가속 가능, 머리카락과 퍼가속 2개 추가되었고 실시간으로 2배 빠른 속도를 제공한다.
엔비디아는 노트북 위해 Max-Q 지속하며 개선해오고 있으며 블랙웰과 GDDR7 메모리로 최적의 전력 효율성을 제공하고 그래픽 메모리를 조절한다. 전체 배터리 수명은 이전 세대 노트북 대비 최대 40% 향상, 한 번의 충전으로 40% 더 오래 사용 가능하다. 전력이나 성능을 희생하지 않고도 세련된 디자인을 유지하는 얇고 가벼운 노트북을 구성할 수 있다. DLSS 4와 함께 하면 AAA급 게임의 프레임을 높여 원활한 플레이가 가능해진다.
진보된 파워 게이팅(Advanced Power Gating, 클럭과 파워 및 레일 게이팅)으로 전력 효율 개선, 칩 넓은 전력 제어가 가능하다. 유효전력 개선으로 10배 빠른 딥슬립 단계 진입이 가능하며 50% 전력 효율 개선이 이루어진다. 또 천배 빠르게 동적 제어 가능하며 GPU 워크로드에 따라 효율적으로 동작한다. 과거에는 프레임 생성 중 클럭 고정해야 하나 지금은 자동으로 클럭 등을 조절한다. GDDR7 메모리를 처음으로 도입하는 맥스웰은 pam3 기술로 더 낮은 전압에서 더 높은 클럭 달성이 가능하며 2배(2X) 데이터와 2배의 효율이 향상된다.
RTX Mega Geometry On
RTX Mega Geometry Off
블랙웰은 빛의 표현이 보다 뚜렷해지고 사람의 얼굴을 실시간으로 렌더링하는 능력도 향상됐다. RTX 뉴럴 레디언스 캐시는 빛의 광선 레이(Ray)를 캐시에 저장하고 빛이 여러 사물에 부딪혀 나오면 실시간으로 추정해 결과를 반영한다. 게임을 플레이하는 동안 실행되며 스스로 계속 학습해 더 좋은 결과를 만들어낸다. RTX 스킨은 빛의 투과도 세밀하게 묘사하며 그림자 등을 세밀하게 표현해 인간의 피부를 보다 사실적으로 표현해준다.
게임 캐릭터 렌더링은 실시간 그래픽에서 가장 어려운 작업 중 하나로 이는 사람들이 가장 작은 오류나 아티팩트도 알아차리기 쉽기 때문이다. 렌더링에서 인간답지 않고 어색하게 느끼지는 현상인 불쾌한 골짜기를 개선한다. RTX 뉴럴 페이스(RTX Neural Faces)는 생성형 AI로 인간의 자연스러운 표정을 만들며 학습 모델은 실시간으로 표정을 추론하고 최대한 인간 다운 얼굴을 만들어준다. 레이 트레이싱된 머리카락과 피부를 위한 새로운 RTX 기술로 보완되며 최대 100배 더 많은 레이 트레이싱된 삼각형을 구현할 수 있는 RTX Mega Geometry와 게임 캐릭터와 환경에 대한 현실성을 크게 향상할 수 있다.
맥스웰 GPU는 창의적인 워크플로우를 엄청나게 강화한다. FP4는 이상적이며 연산의 정확도를 향상하며 처리량을 2배 늘릴 수 있다. FP4 정밀도를 지원하는 최초의 소비자용 GPU인 RTX 50 시리즈 GPU는 FLUX와 같은 모델의 AI 이미지 생성 성능을 2배 높이고 생성 AI 모델을 이전 세대 하드웨어에 비해 더 작은 메모리 공간에서 로컬로 실행할 수 있다.
블랙웰 아키텍처에서는 4:2:2를 지원한다. 4:2:2는 과거 CPU에 의존해 CPU 점유율이 높아 CPU 자원 활용에 어려움이 있었으나 하드웨어 지원으로 더 많은 화면의 디코드 및 인코드 속도를 크게 향상한다. 또 3개의 9세대(9th Gen) NVENC로 비디오 처리 성능은 물론 화질도 개선했다.
블랙웰의 디스플레이 엔진은 Ada Lovece는 DisplayPort 1.4a HBR3 8.1Gbps를 지원한 반면 DisplayPort 2.1 UHBR20 20Gbps와 High Speed HW Flip Metering, 8세대 인코더와 5세대 디코더를 제공한 Ada Lavace는 AV1과 HEVC, H.264 Decode와 4:2:0 Encode/ Decode 지원에서 블랙웰은 9세대 인코더와 6세대 디코더를 통해 AV1 UHQ와 MV-HEVC, 2x H.264 Decode와 4:2:2 Encode/ Decode를 지원한다.
블랙웰은 게이밍 뿐만 아니라 크리에이터를 위한 향상도 이루어졌다. 생성형 AI(Generate AI)가 비디오 및 오디오 에디터 및 소프트웨어에 도입되면서 AI에 최적화된 지포스 RTX 50 시리즈는 어도비(Adobe)와 다빈치 리졸브(Davinci Resolve) 등에서 프로급 비디오 에디팅을 지원한다.
맥스웰 GPU는 AI TOPS를 제공해 게임 렌더링과 병행하여 자율적인 게임 캐릭터를 구동하며 인간 플레이어처럼 인식하고 계획하고 행동할 수 있는 새로운 NVIDIA ACE 기술을 소개했다. ACE 기반 자율 캐릭터는 KRAFTON의 PUBG에서 NVIDIA ACE 기반 동료는 전략적 행동을 계획하고 실행하여 인간 플레이어와 동적으로 협력하여 생존을 보장한다. InZOI는 삶의 목표와 게임 내 이벤트에 따라 행동을 자율적으로 조정하는 Smart Zoi 캐릭터를 특징으로 한다. MIR5에서 대규모 언어 모델(LLM) 기반 레이드 보스는 플레이어의 행동에 따라 전술을 조정하여 더욱 역동적이고 도전적인 만남을 만든다.
NVIDIA는 RTX 애호가와 개발자가 NVIDIA NIM 마이크로서비스를 사용하여 AI 에이전트와 어시스턴트를 구축하는 방법을 보여주기 위해 Black Forest Labs, Meta, Mistral 및 Stability AI와 같은 최고 모델 개발자의 RTX AI PC용 NIM 마이크로서비스 및 AI 블루프린트 파이프라인을 출시 예정이다. LLM과 비전 언어 모델, 이미지 생성, 음성, 검색 증강 생성을 위한 임베딩 모델, PDF 추출 및 컴퓨터 비전을 포함한다.
NVIDIA Broadcast 앱은 두 가지 AI 기반 베타 기능을 제공한다. 마이크 오디오를 업그레이드하는 Studio Voice와 세련된 스트림을 위해 얼굴을 다시 비추는 Virtual Key Light다. Streamlabs는 NVIDIA ACE와 Inworld AI로 구동되는 Intelligent Streaming Assistant를 출시한다.
엔비디아 블랙웰은 그래픽 기술 발전으로 전통적 렌더링으로 커버가 어려우며 AI로 중복 예측하면 컴퓨트(연산)를 줄일 수 있다. 전통적인 CNC Model은 블랙웰에서는 트랜스포머 모델(Transformer Model)로 이동 데이터를 기준으로 처리한다. DLSS 4에서 트랜스포머 기반 DLSS Ray Reconstruction 및 Super Resolution은 2배 더 많은 매개변수와 4배 더 많은 컴퓨팅이 가능해 더 커지고 연산 효율성과 연산을 획기적 늘리는 것이 가능해진다. 디테일은 강화하고 향상된 안티 앨리어싱, 고스트는 감소한다.
지포스 RTX 50 시리즈는 전작의 DLSS 3를 이어 NVIDIA DLSS 4를 지원한다. DLSS 4는 최대 8배 프레임 속도 향상을 위한 다중 프레임 생성 기술(Multi Frame Generation)을 제공하는 것이 특징이다.
다중 프레임 생성 기술(MFG, Multi FG)은 생성 AI에 의존하여 기존에 렌더링된 프레임보다 최대 3개 프레임 앞을 예측하며 그 자체로 초고해상도의 결과를 구현할 수 있게 된다. DLSS SR은 1픽셀을 4개로 효과적으로 업스케일할 수 있으며(1080p 렌더링을 4K 출력으로 전환) DLSS 4는 다음 3개 프레임을 생성하므로 효과적으로 1:15의 픽셀 생성 계수를 갖는다(16픽셀 중 15개는 렌더링 파이프라인 외부에서 생성).
NVIDIA Reflex 2는 렌더링된 프레임을 디스플레이로 전송하기 직전에 최신 마우스 입력을 기반으로 업데이트하여 게임의 지연 시간을 줄이는 기술인 Frame Warp를 도입한다. 지연 시간을 최대 75%까지 줄일 수 있으며 게이머는 멀티플레이어 게임에서 경쟁 우위를 확보하고 싱글 플레이어 타이틀의 반응성을 높일 수 있으며 45% 지연시간 감소, CPU와 GPU 동기화로 지연 50% 감소한다. 더 파이널스(The Finals)와 발로란트(Valorant)는 리플렉스 2를 지원하며 발로란트 시연을 통해 활성화되면 3ms 정도의 낮은 게임 레이턴시가 적용되는 것을 공개했다.
엔비디아 앱(NVIDIA App)에서는 새로운 DLSS Overrides를 지원해 DLSS 4의 DLSS Multi Frame Generation 기능 등을 활성화해 게임에 적용 가능하다. GeForce RTX 50 시리즈와 함께 출시되는 75개 이상의 게임 타이틀이 DLSS 4를 사용할 수 있다.
엔비디아 지포스 RTX 5080 FE(좌)/ RTX 5090 FE(우)
ASUS/ Colorful/ GIGABYTE/ MSI, GeForce RTX 5080 시리즈
2025 엔비디아 RTX AI 데이(2025 NVIDIA RTX AI Day)에서는 RTX AI PC를 이용한 게임 및 AI 데모를 체험할 수 있었고 지포스 RTX 5080 FE/ RTX 5090 FE(Founder's Edition)와 에이수스(ASUS), 컬러풀(Colorful), 기가바이트(GIGABYTE), MSI 등 파트너사의 지포스 RTX 5080 제품들이 함께 전시됐다.
2025 엔비디아 RTX AI 데이(2025 NVIDIA RTX AI Day)로 진행한 이번 행사는 엔비디아 지포스 업데이트 에디터스 데이 2025(NVIDIA GeForce Update Editor's Day 2025)를 부제로 블랙웰 아키텍처의 소개에 이어 Q&A도 진행됐다.
Q1. 블랙웰 기반의 지포스 RTX 50 시리즈 최대 전력 소모량은 어떻게 되나?
A. 블랙웰 아키텍처는 이전 세대인 Ada Lovelace 아키텍처 대비 전반적인 전력 효율을 개선했다. 이를 통해 노트북은 배터리 사용이나 전력 사용시 효율이 높아졌으며 최대 전력치는 600W로 잡고 있다.
참고로 지포스 RTX 50 시리즈의 기본 스펙은 지포스 RTX 5090이 575W이며 1000W PSU 권장, RTX 5080은 360W이고 850W PSU 권장, RTX 5070 Ti는 300W이고 750W PSU 권장, RTX 5070은 250W이고 650W다.
Q2. 엔비디아 지포스 RTX 40 시리즈 중 12VHPWR(12 Volt High Power) 전원 커넥터를 탑재한 제품에서 이슈가 있었는데 지포스 RTX 50 시리즈 전원 공급 커넥터는 문제 해결되었나?
A. 지포스 RTX 50 시리즈는 RTX 40 시리즈의 12VHPWR 커넥터에서 발생하는 문제는 해결되었다. 지포스 RTX 50 시리즈에서는 RTX 40 시리즈의 커넥터 문제는 없을 것이다.
참고로 12VHPWR 커넥터는 최대 600W까지 전력을 지원했다. 커넥터 체결 문제 등으로 안정적으로 전력이 공급되지 않거나 불안정해지면 과열이 발생해 멜팅 현상이 발생했다. 이를 개선한 것이 12-2x6 커넥터로 12VHPWR의 개선으로 PCIe 5.0 표준과 12VHPWR과 호환 가능하다. 감지 핀의 길이를 짧게 설계하고 커넥터가 완전히 체결되지 않으면 전원 공급이 시작되지 않도록 설계해 안정성을 향상했다.
Q3. 지포스 RTX 5080과 RTX 5090 공급 물량은 적은 것으로 알려지고 있는데 어느 정도인가?
A. 지포스 RTX 50 시리즈 공급 물량에 관련 내용을 자세하게 아는 것은 없다.
Q4. 블랙웰 아키텍처의 디지털 휴먼 아키텍처, ACE는 온보다 디바이스 처리가 목적인가 레이턴시 줄이기 위한 것인지가 궁금하다?
A. Ai 프로세서 엔진으로 더 향상된 작동이 가능하다. ACE와 블루프린트는 개발자 선택에 따라 온디바이스나 클라우드 등 활용이 가능하다. 사용자는 개발자에 맞춰 활용 가능할 것이다.
Q5. DLSS 기술은 프레임은 향상되었으나 지연시간을 줄이는 것이 모든 게임에 가능하나?
A. 기본적으로 DLSS 기술은 프레임과 레이턴시 향상 기술인 리플렉스가 동시에 활성화 되도록 하고 있다. 프레임과 레이턴시는 일반 수준으로 개선된다. DLSS 4와 리플렉스 2를 소개하며 게임 지연시간을 향상하는 리플렉스 2 지원 게임으로 발로란트 등을 소개했다. 발로란트는 게임 프레임과 지연 모두를 개선 가능한 게임 중 하나다. 발로란트가 리플렉스 2 대응 게임이고 DLSS 4 지원 70개 이상 게임은 차츰 적용될 것이다.
Q6. DLSS 오버라이드(Override)는 이전 버전의 DLSS도 사용 가능한가? 블랙웰 에서만 지원하는 것인가?
A. 엔비디아 APP에서는 DLSS 오버라이드(Override)를 드라이버 단에서 직접 적용할 수 있다. DLSS 4는 이전 시리즈가 지원하지 못하는 멀티 프레임 생성 기술이 새로 추가됐다.
Q7. DLSS 4 AI Optical Flow가 새로 보이는데 지포스 RTX 20 및 RTX 30 시리즈에서도 이로 인해 DLSS 지원이 가능해지나?
A. 블랙웰에서만 DLSS 4의 모든 기능을 이용 가능하다. 멀티 프레임 제너레이선(MFG)가 그것이다. 이를 위해 5세대 텐서 코어와 4세대 RT 코어 등 연산 성능이 높고 서로 함께 움직여야 처리가 가능하다. 그만큼 연산 성능이 개선된 하드웨어가 필요한 것이라고 보면 된다. 프레임 생성은 부드러운 화면 적용을 위해 프리미티브 성능 등이 뒷받침되어야 하는 것이고 이전 지포스 RTX 20과 RTX 30 시리즈는 이를 충족하는 충분한 성능을 제공하지 않아 지원이 어렵다.
Q8. 지포스 RTX 50 시리즈가 출시를 앞두고 있다. 국내 가격은 정해졌나?
A. 출시 날짜는 알려져 있다. 다만 앞서 공급 물량에서 답했던 것과 같이 구체적인 가격은 알 수 없다.
Q9. 엔비디아 DLSS 4에서는 멀티 프레임 제너레이션(MFG)가 새로 추가되었으나 프레임 생성이 너무 많아지면 고가 그래픽카드 구매가 잘 안될 것 같은데 프레임은 어디까지 생성 가능한가?
A. DLSS 4는 멀티 프레임 제너레이션(MFG) 를 통해 보다 부드러운 게임 화면 구현과 성능을 향상이 가능했다. 타겟 프레임으로 4K 240fps 정도를 고려하고 있으며 앞으로 얼마나 더 많은 프레임이 가능해질지 프레임 생성 목표는 아직 모르겠다. 저사양에서도 프레임 생성 기술을 활용한 DLSS 기술은 프레임 향상이 가능해진다. DLSS 기술은 게이머들에게 게임의 새로운 차원을 가능하게 해주는 기술이고 앞으로도 더욱 필요해질 것으로 보인다.
Q10. 엔비디아 지포스 RTX 50 시리즈 출시를 앞두고 있는데 일반 사용자에게 추천하는 RTX 50 시리즈는?
A. 발표자들에게 물어본다면 당연히 주저 않고 지포스 RTX 5090이다. 웃음(^^;) 다만 일반 사용자 입장에서 보자면 1080p면 지포스 RTX 5070, 1440p면 RTX 5070 Ti/ RTX 5080이면 충분할 것으로 보인다. 게이머 특성에 따라 다르고 게임이나 해상도에 따라 선택하면 될 것이다.
Q11. DLSS 4 멀티 프레임 제너레이션은 텐서 코어 성능이 필요하며 연산에 따른 FP4 도입으로 절반으로 동일한 이미지 품질을 만들어내는데 게임 렌더링 성능은 레스터 성능은 감소하는 듯 보이며 DLSS가 더 좋아지고 있는데 어떤가?
A. 이미지 모델 크기에 따라 FP4 연산은 달라진다. DLSS 벤치마크에서는 기본적으로 프레임 수치가 아닌 더 나은 사용자 경험에 초점을 맞추고 있다. DLSS 4는 기존 게임 그래픽 품질을 비교 가능한 부분을 캡처해 성능과 함께 비교하는 것이 필요하며 이를 권장한다