AMD는 라이젠 프로세서를 처음 출시한 이후 꾸준히 완성도를 높여왔다. 5세대 중앙처리장치 설계가 적용된 라이젠 9000 시리즈는 어떤 성능적 매력을 품고 있는지 확인해봤다.
Zen 5 설계로 성능ㆍ효율 개선에 집중
라이젠 9000 시리즈 프로세서는 5세대 젠(Zen 5) 중앙처리 설계가 적용됐다. 데이터가 오가는 길(대역폭)을 넓히고 일부 명령어 실행 구조를 변경, 클럭당 명령어 처리 성능(Instruction Per Clock)을 높인 게 특징이다. 이전 세대 라이젠 프로세서에서 지적된 발열과 전력소모를 개선하고자 소재ㆍ공정 등 물리적 요소도 개선했다.
Zen 5 설계에서 돋보이는 부분은 고급 분기 예측이 포함된 듀얼 파이프 펫치(Dual Pipe Fetch with Advanced Branch Prediction)를 적용한 것이다. 분기 예측은 중앙처리장치가 데이터를 처리하는 과정에서 발생하는 위험 요소를 줄인다. 어떤 명령어가 실행되는지 예상한 후 미리 다음 명령어 처리를 준비하는 방식이다. Zen 5 설계는 할당된 자원을 가져오는 핵심 요소들을 재설계했다. 초기 데이터 처리에 필요한 통로를 2중 배치(Dual decode pipes)한 부분이 대표적이다. 실행 파이프라인을 더 넓게 구성해 지연 시간과 정확도를 개선했고, 명령어 공간 대역폭도 확대되면서 처리 지연 시간이 크게 줄었다.
다음 변화는 할당 자원을 배치하고 실행하는 라인을 확장한 것이다. 데이터 실행 순서(스케줄러)를 다듬기 위해 통합 산술연산장치(Arithmetic Logic Unit - ALU)를 활용한다. 기존에는 산술연산장치를 4개 배치해 명령어 처리가 이뤄졌지만, Zen 5 설계는 6개로 늘렸다. 정수 연산을 위한 장치도 추가 배치해 명령어 처리 구조를 최적화했다.
데이터 대역폭도 확대됐다. 12방향(12-Way) 1차 데이터 예비공간(L1 Data Cache)을 48KB 용량으로 구성했는데 이는 이전 32KB 대비 50% 증가한 수치다. 데이터는 클럭당 4회 주기(4회 읽기, 2회 쓰기)로 입출력된다. 2차 예비공간(L2 캐시)도 16방향(16-Way) 1MB 용량으로 구성한 상태다. 그 결과 1차 예비공간의, 대역폭이 2배 상승하면서 클럭당 많은 데이터 처리가 가능하다.
마지막 변화는 512비트 인공지능 데이터다. Zen 5 설계는 고급 벡터 확장 명령어인 AVX(Advanced Vector Extensions)-512를 지원한다. 기존에도 지원했으나 256비트로 두 번 나눠 처리한 것과 달리 완전한 512비트 데이터 처리가 이뤄진다. 부동소수점 피연산자 추가 명령어(Floating ADD) 처리 주기도 3주기에서 2주기로 줄였다. 신경망 가속 명령어 VNNI(Vector Neural Network Instruction)를 추가한 점도 특징이다. 정수와 부동소수점을 다양하게 쓰는 인공지능 데이터 처리 환경에 대응하려는 조치다.
소재ㆍ공정의 변화는 온도 저항성(Thermal Resistance) 개선으로 이어진다. 칩 위에 얹는 방열판(히트스프레더)을 다듬고 안에 채우는 열전도 물질을 일부 바꿔 온도 저항성을 15% 개선했다는 게 AMD 측 설명이다. AMD 자료에 따르면 자사의 동급 열설계전력(TDP) 제품과 비교해 7도 가량 낮은 온도로 작동한다. 온도가 낮아지는 것은 곧 작동속도를 더 높일 수 있음을 의미한다. 기준 속도를 높이는 작업인 오버클럭(Overclock) 작업에 유리할 것으로 예상된다.
열설계전력(TDP) 개선에 따른 전력대비 성능 개선도 기대해 볼 부분이다. 16코어 라이젠 9 9950X 프로세서는 170W로 동일하지만, 12코어인 라이젠 9 9900X는 170W에서 120W가 되었다. 8코어, 6코어 라이젠 프로세서도 기존 105W에서 65W로 낮아졌다. 하지만 성능은 제품에 따라 최대 11~22% 가량 상승했다는 게 AMD 측의 설명이다. 성능 향상이 열설계전력 기준이어서 환경에 따라 다르지만, 기존 동급 제품 대비 성능 향상은 체감이 가능할 것으로 예상된다.
라이젠 9 9950X로 알아본 성능
라이젠 9 9000 시리즈는 이전 세대와 비교해 어느 정도 성능 차이를 보여줄까? 라이젠 9 7950X 프로세서와 라이젠 9 9950X 프로세서를 가지고 비교했다. 게이밍 성능보다 프로세서의 연산 성능에 초점을 두고 시네벤치와 블렌더의 CPU 렌더링 성능을 측정했다.
블렌더의 성능을 확인했다. 테스트는 ▲몬스터 ▲정크샵 ▲클래스룸으로 총 3가지로 진행된다. 1분당 많은 샘플을 출력하는 프로세서가 성능이 좋다.
먼저 몬스터 결과를 보면 라이젠 9 7950X는 1분에 238.325191개 샘플을 출력했다. 이어 라이젠 9 9950X는 1분에 260.709938개 샘플을 출력한다. 성능 향상은 약 9.4%다. 정크샵 테스트 결과를 확인하면 라이젠 9 7950X는 180.581136개, 라이젠 9 9950X는 188.648813개 샘플을 1분에 출력하는 것으로 나왔다. 약 4.5% 정도 성능이 올랐다. 마지막으로 클래스룸 테스트 결과는 라이젠 9 7950X가 125.295344개, 라이젠 9 9950X는 136.937411개 샘플을 1분에 출력했다. 성능 향상은 약 9.3%다.
이번에는 시네벤치 R23판을 실행해 두 프로세서의 성능을 비교했다. 시네벤치는 단일 코어와 다중 코어 항목을 통해 각 상황에 따른 성능 비교가 가능하다.
단일 코어를 기준으로 라이젠 9 7950X는 1789점, 라이젠 9 9950X는 2272점을 기록했다. 약 27% 성능 차이를 보인다. 단일 코어 성능은 작동속도 및 중앙처리장치 설계가 중요하다. 비록 두 중앙처리장치는 16코어를 품었지만, 특정 작업에서는 단일 코어만 쓸 때도 있다. 이 때 라이젠 9 9950X는 상대적으로 빠른 처리 능력을 보여줄 것으로 예상된다.
다중 코어 결과도 보자. 라이젠 9 7950X는 3만 6405점을 기록했는데 라이젠 9 9950X는 14% 더 높은 4만 1528점을 기록했다. 단일 코어에 비하면 조금 아쉽지만, 코어를 모두 쓰는 상황에서도 라이젠 9 9950X는 뛰어난 성능을 제공한다.
마지막으로 시네벤치 2024판을 실행했다. 단일 코어 기준으로 라이젠 9 7950X는 122점, 라이젠 9 9950X는 139점을 기록했다. 차이는 약 14%다. 조금 더 중앙처리장치의 자원을 끌어 쓰는 상황에서도 안정적인 처리 능력을 보여줬다. 그러나 다중 코어 결과는 조금 달랐다. 두 제품의 성능 차이가 4.5% 정도로 좁혀진 것이다. 격차가 크게 줄었지만, 여전히 라이젠 9 9950X의 성능이 우위다.
AMD 플랫폼의 발전 모멘텀을 증명하다
라이젠 9000 프로세서는 중앙처리장치 설계의 변화로 성능 향상을 이뤄냈다. 성능 향상 폭은 소프트웨어 환경에 따라 다르겠지만, 작게는 4%~5%, 크게는 10% 이상이다. 렌더링이나 동영상 변환 등 중앙처리장치를 많이 쓴다면 성능 체감이 가능하리라 예상된다. 게이밍 환경에서는 코어 수보다 작동속도가 중요한데, 기본 작동속도가 상대적으로 낮은 라이젠 9000 시리즈가 조금 불리할 가능성이 있다. 게이머 입장에서는 오히려 3D V-캐시 기술이 적용된 X3D 제품을 기다릴 듯하다.
라이젠 플랫폼은 확장성이 강점이다. 라이젠 9000 프로세서도 기존 AM5 소켓에 그대로 사용 가능하다. 이는 업그레이드 과정에서 비용을 크게 낮출 수 있음을 의미한다. 중앙처리장치와 메인보드 등을 모두 바꿔야 되는 업그레이드가 아닌, 중앙처리장치만 바꾸면 최신 사양의 PC가 된다. 이 정도면 AMD는 플랫폼 발전 모멘텀을 충분히 증명했다고 본다.
글 / IT동아 강형석 (redbk@itdonga.com)
]]>