인텔은 컴퓨텍스 2019 첫날인 28일(현지시간) 기조 연설에서 10나노미터(nm=10억분의 1m) 공정의 '10세대 코어 프로세서' 생산을 알렸다. 10세대 코어 프로세서는 서니 코브(Sunny Cove) 아키텍처의 최신 코어 4개와 11세대 GPU, USB 4.0이 유력한 썬더볼터3 컨트롤러를 하나의 다이에 내장한다.
코어의 전쟁을 시작한 전날 AMD의 맹공에 인텔은 10세대 코어 칩과 모든 코어가 5GHz 이상의 속도를 내는 '코어 i9-9900KS'를 공개하는 차분한 모습을 유지했다. 최신 CPU에 구식 코어를 사용한다는 비난을 받던 인텔이 새로운 10나노 10세대 코어를 공개하며 싱글 스레드와 멀티 스레드 성능을 가속화하는 자신들의 장점을 활용하는 전략을 택했다.
10나노 10세대 코어 프로세서
10나노 서니 코브 코어는 인텔이 오래전 약속했던 32KB 증가된 48KB 데이터 캐시, 256KB에서 2배인 512KB L2 캐시를 갖춘다. 늘어난 캐시 용량은 병렬처리의 가능성을 높이고 한 번에 더 많은 연산 처리를 실행하는 것을 의미한다. 한 번에 4번의 연산을 처리하던 스카이 레이크 아키텍처와 비교하면, 10세대 코어 칩은 한 번에 5번의 연산을 처리한다. 또 적전 세대에서 증가한 L2 TLB, μOps 캐시는 향상된 분기 예측 정확도를 기대할 수 있다. CPU 명령 실행 효율을 뜻하는 IPC(클록당 실행할 수 있는 명령수) 또한 증가했다.
10세대 코어 칩은 10나노미터 공정의 새로운 5가지 아키텍처 특징을 갖는다.
- 새로운 서니 코브 코어(최대 4코어 8스레드, 최대 8MB LLC 캐시)
- 11세대 인텔 내장 GPU 코어(최대 64EU)
- LPDDR4 3733 내지 DDR4 3200 지원
- 썬더볼트3 컨트롤러 온칩 통합
- 아이스 레이크(Ice Lake) 세대 PCH 지원(와이파이6 지원, FIVR 통합)
10세대 코어 칩의 가장 기대되는 개선사항은 CPU다. 인텔 CPU 캐시는 지난 10년 동안 L1 캐시 32KB(명령어)+32KB(데이터), L2 캐시 256KB 구조 변화에 실패했다. 이번 10세대 코어는 CPU 코어 각각의 L1 데이터 캐시는 1.5배 많은 48KB를 L2 캐시는 512KB로 2배 늘렸다. 또 L2 TLB는 직전 세대(1,536)에서 2,048으로 μOps 캐시도 1.5K에서 2.25K로 확대했고 캐시 적중률과 명령 예측 정확도도 높였다는 설명이다. CPU의 명령 실행 효율을 나타내는 IPC(클럭 당 명령어 처리)는 6세대 코어 칩 기준 18%가량 향상됐다.
10세대 코어는 "얇고 가볍고 오래가는" 모바일 CPU로는 처음 'AVX-512' 명령어가 추가됐다. 2세대 제온 프로세서에서 처음 지원한 VNNI(Vector Neural Network Instructions)도 추가됐다. AVX-512 명령어의 일부인 VNNI는 이름에서 알 수 있는 것처럼 GPU 가속이 불가능한 인텔 시스템 환경에서 딥러닝 워크로드 처리 속도를 높일 때 쓰인다. 인텔에 따르면 VNNI을 이용한 연산은 3클록 사이클 작업이 1클록에서 마칠 수 있는 유용한 명령어다. 또한 10세대 코어는 업데이트된 인텔 다이내믹 튜닝(Intel Dynamic Tuning) 2.0을 포함한다. 프로세서 내에 소폭의 열 여유폭을 추가로 넣어서 과열 방지를 위한 스로톨링 걱정 없이 필요에 따라 CPU 또는 GPU가 각각의 부스트 속도로 동작해 최대 성능을 끌어내는 방법이다. 인텔은 이 방법으로 평균 성능이 직전 세대에서 2배 내지 2.5배 향상된다는 설명이다.
코어 i7, i5, i3 플러스 11세대 GPU
10세대 코어 칩은 다이에 통합된 메모리 컨트롤러와 GPU 성능도 강화됐다. 썬더볼트3 컨트롤러도 통합된다. 메모리 컨트롤러는 LPDDR4 내지 LPDDR4X를 선택할 수 있다. LPDDR4는 3,733MHz까지 DDR4는 3,200MHz까지 지원되고 LPDDR4는 최대 32GB까지 DDR4는 64GB까지 용량 확장이 가능하다. 고성능 게이밍 노트북을 원하는 사람들에게 희소식이다.
내장 GPU는 최대 1.1GHz 클록과 3MB L3 캐시를 지원한다. FP32에서 최대 1.12TFLOPS, FP16는 최대 2.25TFLOPS 수준의 성능을 기대할 수 있다는 것이 인텔의 설명이다. 하드웨어 인코딩 및 디코딩에 사용되는 퀵싱크 기능도 한층 더 강화했다. 인텔은 11세대 퀵싱크는 H.265 스트림을 인코딩하면서 비트레이트를 9세대 그래픽의 1/3만 사용한다고 밝혔다.
인텔 10세대 코어 칩은 코어 i3부터 i7까지 적용되며 최대 4코어 8스레드, 터보부스트 최대 4.1GHz로 작동한다. 총 11개 제품으로 구성된다. 9월 독일 베를린에서 개최되는 IFA 2019는 10세대 코어 탑재 라인업의 데뷔 무대가 될 것이다.
한편, 인텔은 올 연말 한정판으로 출시하는 9세대 인텔 코어 i9-9900KS도 선보였다. 코어 i9-9900K처럼 8코어, 16스레드 구성은 동일하지만 기본 클록이 4GHz 향상됐다. 또 8개 코어가 모두 최대 5GHz까지 속도를 끌어올릴 수 있다.
인텔 수석 부사장 겸 클라이언트 컴퓨팅 그룹 총괄 매니저 그레고리 브라이언트는 코어 i9-9900KS가 첨단 기술의 미리보기 격이라며, 앞으로 선보일 것이 더욱 많다는 것을 암시했다. 실제로 데모에서 코어 i9-9900KS는 5.2GHz를 가볍게 돌파하는 흥미로운 장면을 연출했다.
[컴퓨텍스2019 현지취재단 다나와리포터 후크선장]