지포스 RTX 20 시리즈, 라데온 RX 6000 시리즈 이상 그래픽 카드 사용자라면 경험해 봤겠지만, 게임에서의 레이 트레이싱은 상당히 높은 성능 저하를 불러온다. 레이 트레이싱 자체가 실시간으로 화면내 빛의 괘적과 그로 인해 발생하는 반사, 그림자, 불투명도 등 다양한 영향을 계산해야 하기 때문에, 필연적으로 제한적인 광원을 사용함에도 그렇다.
이처럼 모든 픽셀에 반사되는 빛을 계산하지 않기 때문에 실제 레이 트레이싱의 원 화면을 보면 자글 거리는 노이즈가 가득 끼게 마련이고, 이러한 노이즈를 제거해 화면을 매끄럽게 표현해주기 위한 목적으로 디노이저(denoiser)를 사용하는 것이 일반적이다.
단지, 디노이저에 최적화된 경우라면 최적의 화면을 보여줄 수 있지만, 게임 같이 수시로 화면 내용이 바뀌는 경우라면 일부 화면이 뭉개지고 부정확한 화면을 보여줄 위험이 있다. 민감한 게이머가 아니라면 크게 문제될 수준은 아니지만, 기껏 성능 저하를 감수하고 적용한 레이 트레이싱의 품질 하락을 감수해야 한다는 건 분명 아쉬운 내용이다.
이에 맞춰 엔비디아는 현재 트랜드인 AI 기술을 사용한 디노이즈 기술인 레이 리컨스트럭션(Ray Reconstruction)을 발표했다. 레이 리컨스터력션은 DLSS 3보다 다섯 배 더 많은 데이터를 훈련하고, 여기에는 공간 및 시간적 픽셀 구분, 엔진 데이터, 레이 트레이싱 이펙트 들이 포함된다.
덕분에 일반적인 디노이저를 쓸때보다 훨씬 더 사실적은 그래픽을 구현할 수 있고, 성능도 개선할 수 있다. 레이 리컨스터럭션 자체는 프레임 생성과 달리 모든 RTX 그래픽 카드에서 사용할 수 있지만, 엔비디아는 RTX 40 시리즈에서 가능해진 프레임 생성과 함께 사용된 경우를 별도로 DLSS 3.5로 구분한다.
마침 사이버펑크 2077에서 레이 리컨스트럭션이 포함된 DLSS 3.5를 지원하는지라 간단히 실제 게임에서의 효과를 검토해 보겠다.
DLSS 3.5로 더 개선된 레이 트레이싱 경험
레이 리컨스터럭션 기능은 이름처럼, 기본적으로 레이 트레이싱 활성화가 필요하다. 사이버펑크 2077의 경우 아쉽지만 모든 레이 트레이싱 옵션에서 지원하지 않고, 패스 트레이싱이라는 기술 명칭으로도 잘 알려진 '레이 트레이싱: 오버드라이브' 옵션에서만 활성화된다.
일반 레이 트레이싱이 게이머의 눈(종착점)을 시작으로 빛의 흐름을 역추적해 광원(시작점)에 도착하는 것과 달리, 패스 트레이싱은 광원의 시작점에서 빛을 추적해 화면을 그려내는 만큼 더 많은 연산력을 소모한다. 이 말은 곧 고성능 그래픽 카드로도 버거울 수 있다는 의미인 만큼, 텐서코어로 처리해 조금이나마 성능을 보완해 줄 수 있는 레이 리컨스트럭션의 효과를 극대화할 수 있는 환경이다.
위 스크린 샷은 사이버펑크 2077에 업데이트된 레이 리컨스트럭션이 포함된 DLSS 3.5와 해당 옵션을 뺀 DLSS 3.0의 화질을 비교한 것이다. 캡처 이미지를 1:1 크롭한 사진으로 DLSS 3.5에서 화면의 디테일이 살아나는 것을 볼 수 있으며, 위 이미지 중 해당 각 부분을 클릭하면 원본 이미지를 확인할 수 있으니 참고하기 바란다.
DLSS 3.5의 성능 차이는?
기가바이트 지포스 RTX 4060 Ti 윈드포스 OC 제이씨현(좌)
기가바이트 지포스 RTX 4070 윈드포스 OC 제이씨현(우)
그렇다면 성능은 어떤지 테스트해봤다.
테스트에는 엔비디아에서 Full HD 게이머를 타켓으로 내놓은 지포스 RTX 4060 Ti와 QHD 게이머 대상의 지포스 RTX 4070 기반 제품으로 테스트했다. 테스트에는 기가바이트 지포스 RTX 4060 Ti 윈드포스 OC 제이씨현과 기가바이트 지포스 RTX 4070 윈드포스 OC 제이씨현 그래픽 카드를 이용했다.
이름 그대로 팩토리 오버클럭된 모델이지만, 부스트 클럭 기준 10MHz와 15MHz 높아진 만큼 엔비디아의 파운더스 에디션급 성능으로 보아도 무방하리라 판단된다. 기가바이트 RTX 4070 윈드포스 OC 제이씨현 모델은 엔비디아 레퍼런스 가이드와 달리 듀얼 8핀 대신 싱글 8핀 보조전원 커넥터를 택해 PSU 호환성을 높였다.
테스트는 인텔 코어 i7-14700K/ DDR5 6000MHz 16GB*2/ 윈도우 11 환경에서 각 그래픽 카드의 타겟 대상인 Full HD(RTX 4060 Ti)와 QHD(RTX 4070) 해상도의 결과만 정리했다.
보면 레이 트레이싱없는 울트라(FSR OFF) 프리셋에서는 각 그래픽 카드의 성능이 평균 100프레임과 80프레임에 달해 충분한 성능을 발휘한다. 하지만 패스 트레이싱을 적용하면 성능이 약 1/4 수준으로 급락하는 것을 볼 수 있다.
여기에 프레임 생성 기능이 추가된 DLSS3를 적용하면 원래 성능의 약 80%까지 복구되고, 레이 리컨스트럭션 기능을 더한 DLSS 3.5일 때는 약 90%가까이 복구되는 것을 볼 수 있다. 레이 트레이싱 적용에 따른 그래픽 품질 업그레이드는 덤이다.
개인 컴퓨터의 AI 도입, 어디까지 이어질까?
PC 어플리케이션의 AI 도입이 빠르게 이뤄지고 있다. 대표적 이미지 편집 프로그램인 포토샵을 포함해 엔터테인먼트 분야의 게임에 까지 이어지고 있고, 다음은 어떤 분야에 나아갈지 기대를 갖게 한다.
엔비디아는 업스케일링이나 레이 리컨스트럭션 같은 부가 기능을 벗어나 아예 게임 월드를 AI로 구현하는 수준을 목표로하는 듯 하지만, 언제 이뤄질지 단정하기 어려운 것도 사실이다.
기업 단위의 AI 서비스와 구현을 위한 전용 칩 개발이 이뤄지고 있지만, 소비자 입장에서는 아직 AI 연산의 최전선에서 활약하며 즐거운 게임 경험까지 제공하는 그래픽 카드의 발전을 관심있게 지켜볼 일이다.
Copyrightⓒ 넥스젠리서치(주) 보드나라 미디어국. www.bodnara.co.kr