비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

단순 코어와 클럭으로 끝이 아니다, CPU에 숨은 성능 요소는?

2018.09.06. 15:12:38
조회 수
3,188
2
댓글 수
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

10여년간 쿼드 코어에 머물러 있던 인텔의 메인스트림 데스크탑 CPU가 8세대 커피레이크의 6코어에 이어 9000 시리즈에서는 8코어로, 하이엔드 데스크탑은 코어 X 시리즈의 18코어에 이어 최대 28코어의 코어 A 시리즈가 예고되어 있다.

바야흐로 다코어 시대가 열리고 있다.

요즘 같은 멀티 스레드 시대에 다코어는 가장 직접적인 CPU 성능 향상을 위한 지름길이다. 인텔이 데스크탑용 6코어 커피레이크를 발표하며 그동안 하이엔드 데스크탑 CPU에서 이야기하던 메가 태스킹을 언급한 것도, 그만큼 최신 프로그램들의 멀티 스레드 활용이 활발해진 것은 반영한 것으로 보인다.

 

코어를 늘리는 것 외에도 아키텍처를 개선하거나 클럭을 높이는 것도 CPU 성능을 높이는 방법이 되겠지만 각종 보안 이슈와 최적화 및 비용, 발열과 소비 전력, 제조 공정 등 여러가지 문제가 엮여 있는 만큼 코어를 늘리는 것처럼 쉬운 일은 아니다.

그런데 여기서 의문이 하나 생긴다. CPU의 성능 개선은 클럭과 코어 개선외에 다른 방법은 없을까? 물론 아니다.

 

혼자서 힘들 때 발휘되는 품앗이의 미덕, 코프로세서에 주목

잠시 시선을 돌려 8월 게임스컴에서 발표된 엔비디아의 지포스 RTX 시리즈에 쓰인 튜링 GPU를 살펴보자.

 

해당 GPU는 CUDA 코어만으로는 게임 내에서 실시간 처리하기 어려웠던 실시간 레이트레이싱을 위해 그를 전담하는 RT 코어, 볼타 이키텍처에 딥 러닝과 머신 러닝을 위해 도입된 텐서 코어를 도입했다.

즉, 쿠다 코어는 지금처럼 게임 그래픽을 그려내면 거기에 RT 코어와 텐서 코어가 레이트레이싱을 덧칠하는 방식으로 실시간 레이트레이싱을 구현한 것이다. 물론 별도의 연산을 필요로하는 만큼 완전히 끄는 것보다 성능이 낮아지기는 하지만, 거의 불가능한 수준이었던 예전과 비교하면 하늘과 땅 차이다.

 

모르는 사람도 있겠지만 그래픽 카드의 역할은 당초 CPU 였다. 지금은 거의 완전히 별개의 카테고리로 인식되지만 CPU의 역할을 분담한다는 면에서 따지자면 코프로세서로 분류할 수 있으며, 초기 CPU는 그래픽 카드 외에도 여러 종류의 코프로세서가 있어왔다.

일단, FPU라고 불리는 부동소수점 연산 유닛(FPU) 초기 IBM PC에서는 별도의 칩으로 제공되었고, 인텔 386 시절에는 80387 부동소수점 연산을 위한 코프로세서가 사용되었고, 486 이후에는 CPU에 통합되기에 이른다.

코프로세서는 CPU에만 있는 것이 아니라 사운드 카드에도 다중 채널 혼성과 실시간 DSP 효과를 위한 코프로세서가 사용되었고, 엔비디아의 GPU 물리연산 기술인 PhysX는 당초 에이지아에서 개발한 코프로세서 성격의 확장 카드로 시작되었다.

 

인텔이 서버와 슈퍼컴퓨터, 하이엔드 워크스테이션 등에 연산 가속용으로 x86 명령어 셋을 이용할 수 있도록 개발한 제온 파이도 코프로세서의 일종으로, 아직까지 코프로세서는 그 명맥을 이어오고 있다.

코프로세서는 엄밀한 의미에서 CPU의 성능 향상으로 보기 어렵지만, CPU의 부족한 성능을 보완해줄 수 있다는 점에서 한가지 방안으로 볼 수 있다.

 

CPU의 성능 진화, 코프로세서 통합과 새로운 명령어의 도입

코프로세서는 현재의 CPU로는 실행이 어렵거나 오래 걸리는 작업 시간을 단축 시켜줄 수 있지만, 별도의 컨트롤러 형태인 만큼 공간과 비용이 높아질 수 밖에 없다. 다행히 기술 발전에 힘입어 FPU나 피직스 카드처럼 자연스럽게 CPU 같은 주 프로세서에 흡수되는 경우도 있지만, 처음부터 특정 작업을 위해 개발된 기능도 있기 마련이다.

 

대표적으로 1990년대 후반 출시된 펜티엄에 포함된 MMX(MultiMedia eXtension) 명령어를 들 수 있는데, 하나의 명령어로 동시에 다수의 데이터를 처리하는 SIMD(Single Instruction Multiple Data) 기법이 사용되는 이들 명령어 셋은 병렬 처리 방식의 코프로세서와는 다르지만 처리 과정을 대폭 단축시킬 수 있으므로, CPU에서 지원하고 안하고는 상당한 성능 차이로 이어진다.

인텔 펜티엄 MMX에서 본격적으로 이야기되기 시작한 SIMD 명령어셋은 하나의 명령어로 다수의 데이터를 동시 처리한다는 점에서 메크로와 유사한 면이 있다. 마침 당시 떠오르기 시작한 3D 가속 카드와 맞물려 주로 멀티미디어 처리 관련으로 주목을 받았다. 손노리의 화이트데이, SEGA의 버추어캅과 버추얼 온 등의 타이틀이 이들 명령어를 지원해 미지원 CPU 대비 높은 성능을 끌어냈고, 버추얼 온의 경우 MMX 지원 CPU 탑재 시스템에 번들 프로모션이 계획되기도 했다.

 

CPU-Z 같은 외부 유틸리티로 쉽게 확인 가능한 CPU의 SIMD 명령어 셋은 처음 멀티미디어 처리에 집중되어 있었으나 암호화(AES), 가상화(VT-x), 메모리 관리(EM64T), 미디어 및 부동 소수점 연산 가속(FMA), 병렬 운영 개선(TSX) 등 다양한 용도의 명령어 셋이 추가되고 있다.

물론 같은 CPU로 분류되도 사용자층에 따라 가격과 코어, 클럭 등 여러가지가 다른 것처럼, CPU의 명령어셋도 차이가 있는 것은 당연하다면 당연한 일로, 인텔의 하이엔드 데스크탑 CPU 제품군인 코어 X 시리즈에는 메인스트림 제품군에는 볼 수 없는 AVX512 명령어셋이 추가 지원된다.

 

하이엔드 데스크탑 전용 명령어, AVX512는 무엇?

AVX(Advanced Vector Extensions)는 2011년 인텔 2세대 샌디브릿지 부터 지원이 시작된 명령어로, 기존에 쓰이던 SSE의 128bit보다 빠른 256bit 동작과 메모리 클러스터 구성 변경 등의 개선이 이뤄졌다.

간략히 비교하자면 AVX는 한 번에 128개의 데이터 처리가 가능했던 SSE와 비교해 최대 256개까지 처리 할 수 있게 되었고, 이를 통해 작업에 따라 최대 2.5배까지 처리 성능을 높일 수 있다.

 

하스웰에서는 AVX 명령어를 개선한 AVX2가, 이후 하이엔드 데스크탑 CPU인 코어 X 시리즈에서는 512bit 부동소수점 처리가 가능한 AVX512 지원이 이뤄졌다. 이에 따라 SSE를 지원하던 네할렘과 비교해 사이클당 부동소수점 처리 능력이 여덟배 향상되었으며, AVX2와 비교해서는 두 배 개선되었다.

이를 통해 부동소수점 집약적인 과학 시뮬레이션, 금융 분석, 인공 지능(AI) 딥 러닝, 3D 모델링 및 분석, 이미지 및 오디오/비디오 프로세싱, 암호화, 데이터 압축 등의 워크로드 성능을 가속화한다.

 

오버클럭 부하 테스트 용도로 익숙한 린팩(Linpack)을 예로 들자면, AVX512를 활용할 경우 소비전력은 거의 그대로 유지하면서 AVX2 대비 약 60% 성능이 높아지고, 결과적으로 소비전력과 클럭당 부동소수점 연산 성능이 두 배 가까이 개선되었다.

린팩은 컴퓨터에서 수치 선형 대수를 처리하기 위한 소프트웨어 라이브러리로, 기본적인 벡터와 행렬 연산을 BLAS(Basic Linear Algebra Subprograms) 라이브러리를 이용하여 계산하며, 부동소수점 처리에 집중되어 있다.

 

인텔이 데스크탑 CPU 중 코어 X 시리즈에만 AVX512를 지원한 것은 제품군별 차별화 전략으로 볼 수 있는데, 아직 컨텐츠 '소비자'에 가까운 메인스트림 사용자용으로 AVX 명령어를 지원하는 프로그램은 매우 제한적이다.

그에 비해 하이엔드 데스크탑 CPU나 서버용 제온 프로세서처럼 컨텐츠 크리에이터를 위한 프로그램 중에는 무료 렌더링/ 에니메이션 프로그램인 블랜데, MS 비주얼 스튜디오 2017 C++ 컴파일러, JAVA9 등 다수의 컴파일러, 중력파 시뮬레이션을 위한 Einstein@Home 프로그램 등, 일반인 사용자와는 거의 연관이 없는 전문 분야에서 쓰이고 있다.

 

인텔의 발표에 따르면 코어 X와 제온 스케일러블 프로세서, 제온 파이 시리즈에 적용된 AVX512를 지원하는 경우 인공지능과 딥 러닝 성능은 최대 2.2배, 암호화 해싱 성능 3.1배, 데이터 보호 및 HPC 작업에서 최대 1.63배의 성능 개선 효과를 기대할 수 있다.

AVX512를 사용할 경우 그만큼 동시 처리 가능한 데이터가 급격히 늘어나 CPU의 부하, 즉 발열로 이어지기 때문에 쿨링에 더욱 신경 쓸 필요가 있다. 이는 전버전인 AVX2에서도 마찬가지라, 메인스트림 CPU 오버클러커들 사이에서는 AVX2 관련 설정을 별도로 조정하기도 한다.

 

시대를 반영한 CPU 명령어 셋, 효과적 작업 효율 개선

 

컨텐츠 소비층인 일반 메인스트림 사용자가 눈 높이를 낮춘다면 특별히 고사양 PC가 필요없을 정도로 PC 성능은 대폭 개선되었다. 하지만 컨텐츠-서비스 생산자 입장에서 보면 아무리 고성능 제품이 나온다해도 만족하기 어렵다.

남들 보다 빨리, 더 나은 서비스로 차별화하고, 기존 기술들을 결합해 새로운 영역을 개척하기 위해서는 그만큼 빠른 분석-창작 도구가 필요하며, 현재 그 중심에는 CPU와 GPU가 있다.

GPU는 일반 게이머에게도 게임 성능과 레이트레이싱 같은 화려함으로 눈길을 끄는 반면, CPU는 코어 확대와 클럭 개선이 주로 주목받고 있지만, MMX와 AVX, 코어 X 시리즈의 AVX512처럼 시대 흐름에 맞춘 명령어 지원이 병행되지 않는다면 하드웨어 개선 이상의 성능 향상을 바라긴 어렵다. 그러다 보면 어느 순간 10nm 공정 양산 연기와 같은 정체기에 빠지기 쉽다.

 

인텔은 다음 세대 서버용 제온 프로세서인 Cascade Lake-SP에는 AVX512를 기반으로 현 시대 IT 시장의 화두인 딥러닝과 AI 추론 가속을 위한 VNNI 명령어를 추가할 예정이며, 인텔 제온에 근간을 둔 인텔 하이엔드 데스크탑 프로세서 역시 차세대 코어 X, 혹은 코어 A 시리즈에서 VNNI를 지원할 가능성이 높다.

물론 코어 X 시리즈에 추가된 AVX512 같은 명령어 셋은 코프로세서와 같이 목표로 한 특정 작업에서 응용 프로그램이 지원할 때만 제대로된 성능을 기대할 수 있다는 한계가 있지만, 미 지원 CPU에 비해 수 배의 성능 개선을 기대할 수 있어 작업 효율을 높일 수 있다.

사용자들이 요구하는 명령어 셋이 우선 지원되기에 IT 트랜드도 반추할 수 있는 만큼, CPU가 어떤 명령어 셋을 지원하는지 주목해보자.



Copyrightⓒ 넥스젠리서치(주) 보드나라 미디어국. www.bodnara.co.kr

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.

관련 카테고리

1/1
최신 기획뉴스 전체 둘러보기
1/1
엔비디아와 그래픽카드 제조를 '따위' 취급한 댓가를 치르는 한국 AI 하드웨어 제조산업 [PC흥망사 122] (1) 동영상 있음 보드나라
CATL 엄청난 나트륨 전지 발표! "얼마나 엄청나길래?" (1) 동영상 있음 오토기어
게임기에서 독점이 중요한 이유... 지금의 스위치를 있게 만든 1등 공신들 동영상 있음 집마 홀릭TV
최고의 노트북 배터리 관리는 '스마트'한 습관입니다! (7) 다나와
[순정남] 게임은 죽었지만 밈은 남았다 TOP 5 (3) 게임메카
아프리카 기차여행, 더 로열 리빙스톤 익스프레스 (1) 트래비
[생활 속 IT] 네이버 지도, 거리뷰 3D로 생생하게 길찾기 (1) IT동아
[IT하는법] 안경 없어도 시야 확보하는 '접근성 돋보기' (2) IT동아
국내 최대 원메이크 레이스 ‘현대 N 페스티벌’ 개막... TCR과 공동 개최 (1) 오토헤럴드
에디터가 추천하는 일본 사가 료칸&호텔 (3) 트래비
더 아남 무이네, 베트남 무이네에 내려앉은 품격 (2) 트래비
A Fine Vintage, 여행자의 기념품 (1) 트래비
[순위분석] 건담 윙 달고 천상계 도약한 오버워치 2 (2) 게임메카
[기승전결] 간만에 등장한 국산 좀비 '다키스트 데이즈' (2) 게임메카
이어폰 없이 혼자만 소리를 들을 수 있다? (2) 과학향기
日보다 높은 자동차 생산 인건비, 韓 우수한 엔지니어링과 자동화로 통제 오토헤럴드
[MBTI] 2025 Ver.  MBTI별 추천 여행지 (4) 트래비
맛으로 가득찬 실크로드, 프랑스 리옹 (2) 트래비
폭삭 속았수다, 제주 (3) 트래비
Travie 20th Anniversary | 20년 전,  그땐 그랬지 (1) 트래비
이 시간 HOT 댓글!
1/4