▲ AI generated image @ChatGPT 4o
사진을 지브리 스타일로 바꾸거나, 긴 문서를 빠르게 요약하고, 생소한 외국어로 작성된 문서를 유창하게 번역하는 등 생성형 AI는 이제 일상의 필수 도구가 되었다. 초기에는 클라우드를 기반으로만 가능했던 이러한 작업들이 최근 로컬 디바이스에서 직접 구현 가능해지면서 PC의 AI 처리 능력에 대한 관심이 높아졌다. 특히, AI 성능의 핵심으로 GPU의 역할이 부각되고 있다. 기존에 게이밍 성능 평가의 기준으로 인식되었던 GPU는 이제 생성형 AI 성능을 결정짓는 핵심 요소로 자리매김했다.
▲ MSI 스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED W11<5,999,000원>
이러한 변화에 발맞추어 MSI는 최신 RTX 5080 GPU를 탑재한 '스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED'를 선보였다. 이 초고성능 GPU 덕분에 AAA급 게임을 최고 품질로 매끄럽게 플레이할 수 있는 것은 물론이고, 포토샵이나 프리미어 등 창작 소프트웨어에서 제공되는 AI 기능을 빠르게 수행하여 창의적 작업의 효율성을 크게 높일 수 있다. 특히 오픈소스로 제공되는 소규모 언어 모델(SLM)을 자체적으로 설치하고 활용할 수 있어 네트워크 연결 없이도 생성형 AI 기능을 사용할 수 있다는 장점도 제공한다. 이는 민감한 정보의 외부 유출 가능성을 차단해 보안성을 크게 높이며, 문서 요약, 번역, 이미지 편집 등 창작 작업의 생산성을 높이는 데 유리하다.
따라서 MSI 스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED에 탑재된 지포스 RTX 5080 GPU가 실제 업무 환경에서 어떤 영향을 미치며, AI 업무에 있어 GPU의 역할이 얼마나 중요한지 기사를 통해 살펴본다.
RTX 5080과 미니 LED 4K+ 탑재한 고성능 노트북의 새 기준 제시
게이머와 크리에이터를 모두 겨냥한 ‘MSI 스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED’는 인텔과 엔비디아의 최신 하드웨어를 탑재하고, 차세대 디스플레이 기술을 도입한 것이 특징이다. 18인치 UHD+ 해상도(3840x2400)에 100% DCI-P3 색역과 HDR 1000을 지원한다. 최대 120Hz의 고주사율과 함께 SDR 환경에서도 700니트 이상의 밝기를 제공하며, 1008 ZONE 로컬디밍으로 구성된 미니LED를 써 2,000,000:1의 명암비로 밝음과 어두음의 차이를 명확하게 표현한다.
CPU는 인텔의 최신 코어 Ultra 9 275HX를 탑재했다. 총 24코어와 40MB 캐시, 최대 5.4GHz의 부스트 클럭으로 강력한 연산 성능을 제공한다. 여기에 GPU는 엔비디아 지포스 RTX 5080 랩탑 GPU(16GB GDDR7)를 장착해 AI 가속, 실시간 레이트레이싱, DLSS 4 등 최신 기능을 모두 지원한다.
메모리는 DDR5 64GB(최대 96GB까지 확장 가능), 저장 장치는 2TB 용량의 NVMe PCIe SSD(Gen4x4)로 구성되어 있어 대용량 데이터 작업이나 고사양 게임 환경에서도 쾌적한 속도를 유지한다. 운영체제로는 Windows 11 Pro가 기본 탑재된다.
입출력 포트는 Thunderbolt 4를 지원하고, HDMI 2.1 포트를 통해 8K@60Hz 또는 4K@120Hz 출력이 가능하다. 이 외에도 SD카드리더, Killer WiFi 7, 블루투스 5.4 등 최신 연결 사양을 폭넓게 갖췄다. 스틸시리즈 Per-Key RGB 백라이트가 적용된 키보드가 안티고스트 기능을 품고 있으며, 오디오는 2W 스피커 2개와 2W 우퍼 4개로 구성된 다인오디오 사운드 시스템을 통해 몰입감을 더한다. 배터리는 99.9Wh 대용량을 장착했으며, 무게는 약 2.89kg, 두께는 19.9mm로 18인치급 노트북임에도 휴대성을 고려한 설계가 돋보인다.
발열 관리 역시 개선됐다. 베이퍼 챔버 쿨러를 채택, 넓은 방열 표면으로 열이 빠르게 배출된다. 2개의 커다란 냉각팬이 있으며, 추가적인 팬 천공으로 내부 공기 흐름을 만들어 내 냉각 효율을 한껏 끌어올렸다. 보안 기능으로는 IR FHD 웹캠(프라이버시 셔터 포함), 지문 인식, TPM 2.0 등을 지원한다. 또한 하드웨어와 소프트웨어 기반의 AI 엔진이 전력 효율과 성능 최적화를 자동으로 수행해 고성능이 필요한 순간과 절전 모드를 지능적으로 조절할 수 있다.
온디바이스 AI 시대, 왜 GPU가 NPU보다 결정적일까
<이미지 출처 : 엔비디아 홈페이지>
온디바이스 AI는 클라우드 서버를 거치지 않고 스마트폰이나 PC 같은 단말기에서 직접 AI 기능을 실행하는 기술이다. 네트워크 연결이 없어도 지연 시간이 짧고, 보안이 강화되며, 에너지 소모를 줄일 수 있다는 것이 장점으로 꼽힌다. 모바일 기기에서는 저전력 전용 하드웨어인 뉴럴 프로세싱 유닛(NPU)가 주목을 받아왔지만, 생성형 AI가 대형 언어 모델과 고해상도 그래픽을 요구하는 현시점에서는 GPU가 결정적 역할을 맡고 있다. 특히 엔비디아의 RTX 50 시리즈와 같은 최신 GPU는 연산 능력, 메모리 용량, 데이터 타입 지원 면에서 NPU를 능가하며 온디바이스AI 흐름을 주도하고 있다.
<이미지 출처 : 엔비디아 홈페이지>
첫째 이유는 압도적인 AI 연산 능력이다. RTX 5090의 경우 920억 개 트랜지스터를 탑재하고 최대 4페타플롭스의 AI 연산 성능을 제공한다. 이는 이전 세대 RTX 4090 대비 세 배 이상 향상된 수치다. 복잡한 생성형 AI 모델을 실시간으로 처리하려면 이 같은 대규모 연산 성능이 필수다. NPU는 특정 작업을 저전력으로 가속하지만, 총연산량에서는 최신 GPU에 미치지 못한다.
둘째 이유는 다양한 데이터 타입 지원이다. NPU는 지원 형식이 제한적이지만, RTX 50 시리즈는 FP32, FP16, INT8뿐 아니라 FP4 연산까지 지원한다. FP4 지원은 4비트 양자화된 경량 모델을 그대로 메모리에 올려 실행하게 하며, 메모리 사용량을 최소화하면서 정확도를 확보하는 데 도움이 된다.
셋째 이유는 메모리 용량과 대역폭이다. ‘MSI 스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED’에 탑재된 RTX 5080은 16GB GDDR7 비디오 메모리를 탑재하고 960GB/s 대역폭을 제공한다. GDDR7은 초당 1.8테라바이트 대역폭을 지원해 전 세대 대비 두 배 이상 빠르게 데이터를 처리한다. 높은 용량과 대역폭은 생성형 AI 모델을 로컬에서 로딩하고 빠르게 학습·추론하는 데 필수 요소다.
넷째 이유는 그래픽과 AI가 통합된 아키텍처다. RTX 50 시리즈에 도입된 뉴럴 셰이더는 렌더링 파이프라인에 학습된 AI를 적용해 이미지 품질 개선과 프레임 생성 기능을 수행한다. 가상 캐릭터의 얼굴 표현, 다중 레이어 빛 반사 등 복합적인 그래픽 연산을 AI로 대체해 효율을 높인다. 이는 기존 NPU가 제공하지 못하는 차별화된 가치다.
<이미지 출처 : 어도비 홈페이지>
특히 어도비 포토샵(Photoshop), 프리미어 프로(Premiere Pro), 애프터 이펙트(After Effects) 등 대표적인 크리에이티브 도구들은 AI 기반 자동 편집, 리라이팅, 배경 제거, 스타일 전환 등 다양한 기능을 GPU 연산을 통해 처리한다. 어도비는 엔비디아 GPU와의 긴밀한 협업을 통해 실시간 미리보기와 고속 렌더링 성능을 극대화하고 있다.
이러한 작업 환경에 가장 적합한 하드웨어로는 엔비디아 RTX 50 시리즈 GPU가 탑재된 최신 노트북이 꼽힌다. AI 연산에 최적화된 텐서 코어와 향상된 레이트레이싱 성능을 통해 복잡한 영상·이미지 연산도 빠르게 처리할 수 있으며, 동시에 배터리 효율과 발열 관리에서도 뛰어난 성능을 발휘한다.
온디바이스 생성형 AI를 일상적인 워크플로우에 통합하고자 한다면, 최신 GPU의 도입은 이제 선택이 아닌 필수다. RTX 5080를 비롯한 RTX 50 시리즈 고성능 GPU를 탑재한 노트북은 AI 크리에이티브 작업에서 새로운 생산성의 기준이 되고 있다.
지포스 RTX 5080 그것이 알고 싶다
‘MSI 스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED’에 탑재된 지포스 RTX 5080은 엔비디아의 최신 블랙웰(Blackwell) 아키텍처 기반 모바일 그래픽 처리 장치(GPU)이다. TSMC의 4nm 미세 공정으로 제작된 GB203 칩셋을 기반으로, 7,680개의 CUDA 코어, 4세대 RT 코어 64개, 5세대 텐서 코어 256개를 집적했다. 이는 전력 효율성을 높이면서도 레이 트레이싱 및 AI 연산 성능을 크게 끌어올린 결과다.
특히 주목할 점은 차세대 GDDR7 메모리의 채택이다. 16GB 용량과 256비트 메모리 버스를 통해 약 811GB/s에 달하는 압도적인 메모리 대역폭을 확보, 고해상도 텍스처와 복잡한 연산이 필요한 최신 게임 및 작업 환경에서 발생할 수 있는 병목 현상을 효과적으로 해소했다.
RTX 50 시리즈의 전유물인 DLSS 4 기술은 RTX 5080 랩탑 GPU의 강력함을 보여주는 대표적인 기능이다. 향상된 AI 모델과 새로운 멀티 프레임 생성(MFG) 기술이 결합되어, DLSS 3 대비 최대 3배 높은 프레임 생성 효과를 제공한다. 이는 고사양 게임을 QHD 또는 4K 해상도에서 부드럽게 즐길 수 있게 하는 핵심 동력이다.
실제 성능 면에서도 괄목할 만한 향상을 이뤘다. 다음은 Geekbench 6의 OpenCL 테스트 결과이다. 203,666점을 기록하며 압도적인 성능을 입증했다. 이는 이전 세대의 RTX 4090 랩탑 GPU(179,000~180,000점)보다 약 12% 높은 수치이다. RTX 4080 데스크탑 GPU(약 240,000)와 겨뤄도 큰 차이가 나지 않는다.
다음은 Geekbench 5의 CUDA 테스트 결과이다. 242,245로 측정되었으며, 이는 180,000대인 지포스 RTX 4090 랩탑 GPU보다 훨씬 높다.
다음은 CPU, GPU, NPU 등 다양한 하드웨어에서 머신러닝 및 딥러닝 작업을 수행하는 능력을 확인할 수 있는 Geekbench AI 테스트 결과이다. 이 또한 이전 세대 대비 뛰어난 성능 향상을 보여주고 있다.
Adobe Photoshop에서 실제 성능은?
앞서 언급했듯 어도비는 엔비디아와의 긴밀한 협업을 통해 포토샵과 같은 이미지 편집 툴에서 GPU를 적극 활용하고 있다. 포토샵 설정 메뉴에 들어가면 아래 그림과 같이 GPU 가속 기능을 쓸 것인지 선택할 수 있는 화면이 나오며, AI가 필요한 항목에 대해서는 GPU를 써 처리 속도를 높이고 있다.
▲ 생성형 채우기 등 일부 기능은 클라우드에서 실행되므로 GPU 영향을 받지 않는다.
포토샵을 쓰면서 흔히 볼 수 있는 것이 배경 지우기, 채우기, 특정 사물 바꾸기 등과 같은 Firefly 기반 생성형 AI 기능은 Adobe 서버 즉 클라우드에서 이뤄진다. 때문에 GPU에 거의 영향을 받지 않는다.
다만 Neural Filters(뉴럴 필터), Blur Gallery(블러 갤러리), Smart Sharpen(스마트 샤프닝), Oil Paint(유화 필터), Perspective Warp(원근 왜곡), Select Focus Area, (초점 영역 선택), Image Size (Preserve Details 옵션 사용 시) 등의 작업은 GPU 가속이 필수적이거나 GPU를 적극적으로 활용하여 처리 속도와 품질을 향상시킨다. 특히 고해상도 이미지 또는 복잡한 레이어 구조를 다루는 경우 GPU 효과를 톡톡히 볼 수 있다.
▲ Adobe Photoshop AI Super Zoom 7x Work
위 영상은 뉴럴 필터에서 확대 기능(5배)을 사용했을 때 속도 차이를 비교한 영상이다. RTX 5080을 사용한 경우 약 4.5초가 걸렸다. GPU를 사용안함으로 설정 후 확대 기능을 실행하니 약 58.5초로 크게 늘었다.
▲ Adobe Photoshop AI Restoration Work
다음은 오래된 사진을 복원하는데 걸린 시간을 테스트한 결과이다. 마찬가지로 뉴럴 필터 내에 있는 기능 중 하나이다. RTX 5080을 켠 상태에서는 작업이 완료되는데 약 12.5초가 걸렸다. 하지만 GPU 사용을 끈 상태에서는 약 42.8초가 지나서 작업이 끝났다.
이처럼 CPU의 역할도 중요하지만 특정 작업에서는 GPU가 작업 시간을 크게 단축시키므로 크리에이터 환경에서는 시간을 줄여주는 금쪽과 같은 기능이다.
영상 편집에서도 강렬한 RTX 5080의 존재감
영상 편집 소프트웨어인 어도비 프리미어 프로(Adobe Premiere Pro) 또한 GPU가 중요한 역할을 한다. 특히 최신 버전으로 갈수록 GPU의 활용도를 높이고 있으며, GPU 가속을 이용하면 비디오 렌더링, 색상 보정, 인코길, 실시간 재생 등에서 작업 속도가 크게 향상된다. 이는 해상도가 올라갈수록 체감 효과가 크며, 인코딩의 경우 H.264, H.265(HEVC) 코덱으로 내보낼 때 5배까지 속도 차이가 난다. 때문에 작업 속도와 품질에 민감한 크리에이터 환경에서 GPU는 생산성과 직결되는 중요한 요소이다.
▲ Adobe Premiere AI Enhance Speech Work
GPU의 성능을 확인하기 위해 프리미어 프로의 여러 기능 중 음성강화와 장면 편집 탐지를 이용해 차이를 비교했다. 우선 음성강화이다. AI(머신러닝)를 활용해 오디오 클립에서 목소리를 또렷하게 하고, 배경 노이즈를 자동으로 줄여주는 최신 오디오 보정 기능이다. 이를 사용하면 별도의 고급 마이크나 전문 스튜디오 환경이 아니더라도, 마치 스튜디오에서 녹음한 것처럼 깨끗하고 선명한 음성을 얻을 수 있다. 다음은 GPU인 RTX 5080을 이용, 음성강화를 했을 때 처리 시간, 그리고 GPU를 쓰지 않을 때 처리시간을 비교한 영상이다. GPU를 활용할 때에는 약 16.5초만에 처리가 되었지만 GPU를 쓰지 않은 상태에서는 약 495초가 흘러서 작업이 완료되었다.
다음 그림을 보면 음성강화 기능을 쓰는데 있어 GPU이 상당한 역할을 하는 것을 알 수 있다. 음성강화 작동 중 GPU 코어 사용량은 거의 100%에 다다랐으며, 이에 따라 온도, 그리고 메모리 사용량도 소폭 올랐다.
▲ Adobe Premiere AI Scene Detection Work
GPU 활용량이 높은 장면 편집 탐지는 AI 기반 자동 컷 분할 기능이다. 이미 완성된 영상이나 하나의 긴 클립에서 장면(컷) 전환 지점을 자동으로 감지하고, 해당 위치에 컷(잘라내기), 하위 클립, 마커 등을 자동으로 추가해주는 유용한 도구이다. 아래 영상에서 보는 것처럼 GPU(RTX 5080)을 사용한 경우 약 53초가 걸려 작업이 완료되었지만 GPU를 쓰지 않은 상태에서는 약 136초 후에 처리가 끝났다.
다음은 장면 편집 탐지 작업 중 GPU 코어 사용량과 메모리, 온도 변화를 측정한 그래프이다. 음성강화만큼 GPU 의존도가 높은 것은 아니지만 작업 효율성에 있어 일정 부분 영향을 미치는 것을 알 수 있다.
온디바이스로 구동하는 LLM, RTX 5080 여부에 따라 약 4배 성능 차이
‘MSI 스텔스 18 HX AI A2XWIG-U9 UHD+ Mini LED’에 탑재된 지포스 RTX 5080은 뛰어난 GPU 성능도 매력적이지만 16GB나 되는 GDDR7 메모리를 가지고 있다. 때문에 로컬에서 LLM을 구동하기에 적합하다. 특히 양자화 기법을 이용하면 엔비디아 H100 GPU가 아닌 소비자용 GPU에서도 LLM을 사용할 수 있기 때문에 ChatGPT와 같은 클라우드 기반의 LLM에 보안 등의 문제로 민감한 자료를 올리기 꺼려지는 경우 활용하면 매우 좋다.
다음은 LM Studio, 그리고 멀티모달 기능, 확장된 컨텍스트 처리 능력, 강화된 다국어 지원 및 뛰어난 성능을 갖춘 구글의 최신 경량 오픈 AI 모델인 ‘Gemma 3 27B QAT’를 이용한 테스트 결과이다. 설정 메뉴에 보면 지포스 RTX 5080 GPU 선택 항목이 있는 것을 알 수 있다.
▲ Gemma 3 27B QAT AI Summary Work
테스트는 PDF 파일을 업로드 후, 한국어로 요약하는데 걸리는 시간을 측정했다. GPU를 사용한 상태에서는 약 74.2초만에 요약 작업이 끝났다. 하지만 GPU를 사용하지 않는 상태에서는 약 293초가 지나서야 작업이 완료되었다. 이처럼 온디바이스 환경에서 AI를 제대로 쓰기 위해서는 고성능 GPU는 필수적이며, 특히 인터넷 연결이 필요 없는 로컬 환경이라면 최신 GPU가 탑재된 노트북을 선택하는 것은 선택이 아닌 필수이다.
오프라인에서도 작동하는 'AI Robot', 노트북의 새 패러다임
게이머와 크리에이터를 위한 차세대 인공지능 기능인 ‘AI Robot’도 눈 여겨 볼만하다. 이 기능은 MSI가 엔비디아와의 협업을 통해 개발된 로컬 기반 AI 챗봇으로, 인터넷 연결 없이도 작동하며 사용자와 자연어로 소통해 다양한 시스템 제어가 가능하다.
▲ MSI AI Robot 실행 화면
AI Robot은 단순한 음성 명령을 넘어 텍스트 명령까지 인식해, 마치 사람과 대화하듯 노트북의 주요 기능을 조정할 수 있다. 예를 들어 게임 구동 시 성능을 극대화하거나, 영상 편집 작업 중 팬 속도를 낮춰 정숙한 환경을 조성하는 등 다양한 상황에서 원하는 설정을 쉽고 빠르게 적용할 수 있다. 복잡한 설정이나 메뉴 탐색 없이도 원하는 작업을 즉시 수행할 수 있어 직관성과 접근성을 크게 향상시켰다. 또한 온디바이스로 구동되므로 데이터가 외부 서버로 전송되지 않는다. 사용자는 민감한 작업 기록이나 시스템 사용 정보가 외부로 유출될 걱정 없이 AI 기능을 활용할 수 있다.
▲ 마치 대화를 하듯 시스템 상황을 모니터링하고 주요 기능을 제어할 수 있다.
MSI는 ‘AI Robot’의 지속적인 학습과 기능 확장을 예고했다. 앞으로 더 많은 기능을 단계적으로 도입해 사용자가 요구하기 전에 먼저 필요를 예측·제안하는 맞춤형 컴퓨팅 환경을 구현할 계획이다. AI Robot은 RTX 50 시리즈 기반 노트북에서 쓸 수 있으며, 현재는 영어만 가능하다.
기획, 편집 / 다나와 정도일 doil@cowave.kr
글, 사진 / 다나와 이준문 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com