요새 대세는 누가 뭐라고 해도 AI입니다. 하드웨어 회사들은 자사 제품이 AI에서 어떤 강점을 지니고 있는지를 어필하기 위해 노력하고 있지요. 2024년 3월 13일에 AMD와 애즈락은 AMD x ASRock MEET UP AI 2024라는 행사를 열었습니다. 여기에서 AMD는 라데온 그래픽의 최신 업데이트와 함께 AI 기술을 대비하기 위해 어떤 노력을 하고 있는지를, 애즈락은 AI를 쉽고 빠르게 쓸 수 있는 AI 퀵셋 소프트웨어를 소개했습니다.
AMD의 마케팅 디렉터인 Adam Kozak은 이번이 한국의 세번째 방문이라는 인사와 함께, 아주 예전부터 하드웨어를 써왔지만 이제는 정말 다양한 제품이 나온 새로운 시대에 접어들었다고 강조했습니다.
우선 AMD 그래픽입니다. AMD RDNA3 아키텍처는 2세대 레이 트레이싱 가속장치와 AI 가속장치를 포함한 통합 연산 유닛 설계가 특징으로, 최고 24GB GDDR6의 대용량 메모리와 DP 2.1을 지원합니다.
라데온 RX 7000 시리즈의 라인업입니다. 하이엔드에선 라데온 RX 7900 XTX 24GB가, 보급형으로는 라데온 RX 7600 8GB가 있고 얼마 전에는 라데온 RX 7900 GRE 16GB 모델이 글로벌 출시됐는데요. 저마다 목표로 하는 해상도와 시장, 가격대가 다릅니다. 이렇게 보니 라데온 RX 7000 시리즈도 총 7개 모델이니까 갯수가 적진 않군요.
배틀그라운드에서는 보급형인 라데온 RX 7600 XT 16GB도 세 자리수의 프레임을 냅니다. 그 윗 모델은 말할 것도 없고요.
팰월드에서도 라데온 RX 7600 XT 16GB는 풀 HD에서 60프레임 이상을, 최근 출시한 라데온 RX 7900 GRE 16GB는 1440p 기준 110프레임의 성능을 냅니다.
또 다른 화제작인 헬다이버 2에서도 라데온 RX 7600 XT 16GB는 1080p 해상도 기준 60프레임 이상, 라데온 RX 7900 시리즈는 1440p 해상도에서 세자리수의 평균 프레임이 가능합니다.
경쟁 상대인 지포스 RTX 40 시리즈와 비교하면 성능은 평균 12% 높고, 비디오 메모리 용량도 높은 편이기에 가성비가 좋다는 게 AMD 주장의 핵심입니다.
거기에 추가로 성능을 한층 더 높여줄 FSR3 기술을 제공합니다.
AMD FSR3는 AMD 뿐만 아니라 경쟁사를 포함해 다양한 GPU에서 작동하는 업스케일링 기능으로, 350개가 넘는 다양한 게임에서 체감 성능을 높여줍니다.
용과 같이 8의 경우 4K 최고 옵션에서 평균 82프레임이 나오던 것이 FSR3을 켜면 218프레임으로 급상승합니다.
FSR은 오픈 소스라서 다양한 게임 개발사들이 자유롭게 적용할 수 있습니다. 그래서 FSR을 도입하는 게임과 개발사의 증가 속도도 매우 빠릅니다.
하드웨어의 제 성능을 발휘하려면 좋은 소프트웨어가 있어야겠지요. 그래서 AMD는 AMD 소프트웨어: 아드레날린 에디션을 계속해서 개선해 나가고 있습니다.
AMD 소프트웨어: 아드레날린 에디션은 기본적으로 하나의 프로그램에서 AMD의 다양한 제품을 지원하도록 설계했습니다. 그리고 회원 가입이나 로그인 없이도 모든 기능을 쓸 수 있고요. 성능 지표를 간단하게 확인할 수 있는 기능을 제공합니다.
오버클럭과 언더클럭을 비롯한 클럭 조절, 소음을 낮추는 쿨링 조절 등의 기능도 간단하게 설정 가능합니다.
AMD 라이젠과 라데온을 조합해 성능을 높이는 스마트 테크놀러지를 비롯한 기능들을 제공합니다. 스마트 테크놀러지를 켜면 일부 게임/조건에서 30%의 성능 향상 효과가 있다고 합니다.
안티 랙은 CPU에서 지나치게 많은 큐를 보내서 레이턴시가 늘어나는 걸 막아주는 기능입니다.
라데온 부스트를 쓰면 평균 10% 가량의 성능 향상 효과가 있습니다. 해상도를 동적으로 조절하거나 프레임의 쉐이딩 비율을 조정해서 성능을 높여주는 기능입니다.
이런 기능을 제공하는 건 좋은데, 일일이 귀찮게 프로그램에서 찾아 설정하란 말이지?는 아닙니다. AMD도 사용자들이 컨트롤 패널을 자주 들여다보진 않는다는 사실을 알고 있거든요. 그래서 이런 기능을 하이퍼RX 안에 전부 넣었습니다. 요새 각광받는 프레임 생성 기술인 AFMF까지 말이죠. https://gigglehd.com/gg/15665275 하이퍼RX만 켜세요. 최적화는 AMD가 다 알아서 해 줍니다.
발더스 게이트 3입니다. 라데온 RX 7600 XT 16GB에서 1440p 울트라 기준 평균 59프레임이 나오던 것이 하이퍼-RX를 켜자 146프레임으로 올랐습니다.
F1 23.
P의 거짓에서도 마찬가지로 높은 성능 향상 효과를 보여줍니다.
라데온 RX 7600 XT 16GB 기준으로 하이퍼-RX와 AFMf를 사용하면 1.9배의 성능 향상을 가져다 준다는 것이 AMD의 설명입니다.
AMD가 2023년에 했던 일들입니다. 지속적인 드라이버 업데이트로 전년 대비 성능을 16% 높이고, 20개의 WQHL 인증 드라이버를 출시했으며, 게임 출시일에 맞춰 45개의 최적화 드라이버를 내놓았습니다. 그 결과 1억 번 이상의 드라이버 다운로드를 기록했습니다.
게임에서 요구하는 시스템 스펙은 갈수록 높아지고 있습니다. 특히 비디오 메모리의 경우 그 상승세에 자비가 없는데요. 차기작이 나와다 하면 비디오 메모리 용량이 팍팍 뜁니다.
AMD는 라데온 RX 7000 시리즈에서 가격 대비 더 많은 용량의 메모리를 제공합니다. 메모리 용량을 똑같이 맞추면 라데온의 가격이 훨씬 더 저렴하기에, 앞으로 나올 게임의 메모리 요구량을 감안하면 라데온 RX 7000 시리즈가 더 미래 지향적인 제품이라는 설명입니다.
그리고 디스플레이포트 2.1을 지원합니다. 고해상도와 고주사율을 양립한 디스플레이에서 DP 2.1 같은 넓은 대역폭을 지닌 인터페이스는 필수입니다.
얼마 전에 요구 스펙을 업데이트한 프리싱크의 경우 이제 인증을 받은 제품의 수가 4천개를 넘겼습니다.
정리하면 라데온 RX 7000 시리즈는 높은 성능, 대용량 메모리와 디스플레이 기술을 지원해 미래 지향적인 기술 제공, 차세대 게이밍과 AI를 위한 기술을 제공합니다. AI 이야기를 언제 했냐고요? 이제부터 합니다.
라데온 RX 7900 시리즈 그래픽은 최고 192개의 AI 가속기로 높은 AI 성능을 내고, 최대 24GB의 메모리로 대형 AI 모델을 다룰 수 있으며, 다이렉트ML과 노드AI 샤크 등에 최적화하고 ROCM 5.7을 지원합니다.
AMD 라데온 그래픽에서는 게임과 스트리밍, 생성형 AI, 영상과 사진 편집/업스케일링, 머신 러닝 개발 등에서 AI 기능을 쓸 수 있습니다.
요새 AI에서는 FP16 포맷을 많이들 사용하는데, 대형 AI 모델을 다룰 때엔 성능만큼 메모리 용량이 중요합니다. 어지간한 AI 모델을 실행하려면 8GB 이상의 비디오 메모리가 필요합니다. 그리고 크면 클수록 좋지요.
AMD의 AI 최적화 노력입니다. 윈도우에서는 다이렉트 ML, 샤크, HIP SDK 등을 최적화하고 리눅스에서는 AMD ROCm을 제공합니다.
LM 스튜디오는 네트워크에 연결할 필요 없이 로컬에서 대규모 언어 모델을 실행하는 솔루션으로, 윈도우와 리눅스를 모두 지원합니다. 여기에서 AMD의 성능을 확인해 봤습니다.
실시간 처리가 된다고 느끼려면 초당 20토큰을 처리해야 하는데요. 대표적인 LLM인 Llama2에서 라이젠 7 8700G의 NPU는 4.5토큰, 보급형 그래픽인 라데온 RX 7600 XT는 11토큰, 고성능 모델인 라데온 RX 7900 XT는 42토큰이 나왔습니다.
더 작은 모델을 썼을 경우 성능이 꽤 오르네요. 라데온 RX 7600 XT만으로도 초당 40토큰을 뿝어냅니다.
8GB 메모리가 탑재된 지포스 RTX 4060과 비교하면 그 격차는 어마어마합니다. 라데온 RX 7600 XT가 1.16초만에 해낼 일을 지포스 RTX 4060은 18.72초가 걸립니다.
amuse에서 SDXL 터보 모델을 사용해 업스케일링 등의 이미지 작업을 해봤습니다. 라이젠 7 8700G는 2.6초만에, 라데온 RX 7600 XT만 되도 작업에 1초가 채 걸리지 않습니다.
가장 대표적인 이미지 생성 모델인 스테이블 디퓨전 1.5 실행 시 걸리는 시간입니다. 여기에선 차이가 상당히 큰데요. 라이젠 7 8700G는 이미지 한 장에 44초, 라데온 RX 7600 XT는 15.7초, 라데온 RX 7900 XT는 4.6초가 걸립니다.
포토샵에서도 로컬 하드웨어를 사용하는 오프라인 AI 처리를 지원합니다. AMD의 새 드라이버에서 성능이 향상됐음을 알 수 있습니다.
다빈치 리졸브는 오픈CL을 다이렉트ML로 바꾸면서 성능이 최대 5.2배가 개선됐습니다.
토파즈 AI 비디오의 업스케일링 처리입니다. 여기에서도 새 드라이버에서 상당한 성능 향상 효과를 볼 수 있습니다.
다양한 AI 생태계도 구축하고 있습니다. 허깅 페이스, 파이토치, ONNX 런타임 등 AI 업계의 다양한 플랫폼을 지원합니다.
AMD는 마이크로소프트 다이렉트ML, ROCm 5.7, 그리고 ROCm 6.0을 제공합니다. 각각의 조건에서 쓸 수 있는 기능들을 비교한 표입니다.
지포스 RTX 시리즈와 AI 작업 비교입니다. AI 지원, 유명 AI 앱 지원, 성능 가속 등에서 경쟁 상대와 발을 맞추고 있지만 대용량 메모리를 더욱 저렴한 가격에 쓸 수 있다는 것이 라데온 RX 7000 시리즈의 장점입니다.
다음은 애즈락 코리아의 김성현 실장이 소개한 AI 퀵셋입니다.
현재 AI는 만개 이상의 생성형 툴이 존재하고 다양한 분야에서 활용하고 있지만, 채팅 스타일의 AI와 다르게 생성형 AI를 직접 써 본 사람은 의외로 많지 않은데요.
그 효과는 확실하지만 사용 방법을 배우고 설치하고 문제를 찾는 과정이 너무 복잡하기 때문입니다.
깃허브에 등록된 스테이블 디퓨전 설치 가이드입니다. 이걸 보고 그대로 따라하기가 참 쉽지 않다는 게 문제입니다.
애즈락 AI 퀵셋은 클릭 한번으로 설치 과정이 끝난다고 설명합니다. 한 번이라는 숫자는 당연히 과장된 것이지만, 그 설치 방법이 간단한 건 분명합니다.
다운로드 받아서, 설치하고, 기다리고, 실행하면 끝이거든요.
실제로 설치하는 과정도 보여 주었습니다. AI 모델 특성상 설치에 오랜 시간이 걸리기는 했지만 설치 그 자체는 매우 간단했습니다.
애즈락 AI 퀵셋이 지원하는 플랫폼과 애플리케이션입니다. 이미지 생성 외에도 만화를 자동으로 번역해주는 AI도 포함됐네요.
시스템 권장 사양입니다. 그래픽카드는 당연히 라데온 RX 7000 시리즈가 필요합니다.
다이렉트ML 샤크에서 이미지를 생성하는 과정도 시연했습니다. 간단한 이미지 한 장을 만드는데 걸리는 시간은 2.25초 정도네요.
구체적인 이미지 생성 방법도 소개했습니다. 사용할 명령어를 고르고, 배제할 명령어를 고르고, 고급 설정을 만져주면 됩니다.
어떤 명령어를 쓰고 배제할 것인지 정하는 게 이미지 생성 AI의 관건인데요. CivitAI에서는 예제 이미지를 만들기 위해 어떤 명령을 조합했는지를 보여줍니다.
이미지를 선택하면 사용한 명령어와 옵션 등을 자세히 소개합니다.
이를 토대로 만든 다양한 이미지와 그 옵션 들입니다.
현장에서는 애즈락의 메인보드와 라데온 그래픽카드를 탑재한 여러 시스템을 전시해, 직접 AI 작업을 시연할 수 있었습니다.
현장에 전시된 시스템.
끝으로, AMD 세일즈 팀의 이상효 부장은 작년부터 국내에 라데온 전담 엔지니어를 배치해 각종 이슈를 해결하고 있다고 밝혔습니다. 다양한 경로를 통해 들어온 이슈 중에 진짜 라데온 관련 이슈는 10건 중 1개 꼴이긴 했지만, 그런 것까지 일일이 잡아온 결과 지금은 보고된 이슈의 상당 부분을 잡아내 안정성이 많이 개선됐다고 자신했습니다.
또 이슈 발생 시 드라이버에 포함된 버그 리포트 툴로 보고를 적극적으로 해 주시면 반드시 확인해서 문제를 잡아 내겠다는 당부도 덧붙였습니다.
<저작권자(c) 기글하드웨어 무단전재-재배포금지>