안녕하세요, DPG 남영자 덕주임입니다. AMD에서 2020년 연말에 새롭게 내놓은 특허와 관련한 이야기들이 있어서 가져왔습니다. AMD가 미래에 그래픽카드에 활용할 가능성이 있는 내용인데요. 과연 어떤 내용인지 아래에서 함께 살펴보시겠습니다.
1. AMD의 GPU 특허 : 모놀리식을 버리고 칩렛 구조로 넘어가기 위한 초석
위 이미지는 AMD가 2020년 12월 31일 미국 특허청에 등록했다는 특허 중 일부입니다. AMD가 이것으로 정확히 어떤 최종제품을 만들고자 하는지는 아직 알기 어렵지만, 우선 이미지와 내용을 보면 그래픽카드 GPU에 대한 특허라는 것은 알 수 있고. 조금 더 유심히 쳐다보면, 칩렛(Chiplet) 구조에 대한 내용이라는 것을 알 수 있습니다. 더 자세한 내용은 아래에서 풀어보겠습니다. 원문이 궁금하신 분들은 이 URL을 통해 확인해주세요.
https://www.freepatentsonline.com/y2020/0409859.html
2. 모놀리식? 칩렛?
모놀리식(Monolithic)과 칩렛(Chiplet)에 대한 이야기는 사실 그래픽카드 GPU가 아니라 CPU에서 먼저 나온 이야기입니다. AMD가 라이젠 프로세서로 재도약하게 된 계기이기도 하지요.
지금까지의 CPU와 GPU는 모놀리식(Monolithic) 설계를 따랐는데요. 모놀리식(또는 모노리식)이란 것은 쉽게 말하면 일체형입니다. 하나의 칩에 모든 구성요소를 다 새겨서 만드는 전통적인 CPU와 GPU들이 모놀리식 설계로 만든 것입니다. 한때 하나의 PCB에 두 개의 GPU를 장착한 듀얼 GPU 그래픽카드들이 나온 적도 있지만, 그것들도 각각의 GPU는 모놀리식 설계로 만든 것입니다.
그런데 AMD가 모든 것을 바꿨습니다. AMD는 전통적인 모놀리식 프로세서가 점차 고성능, 미세집적 단계로 갈수록 수율 문제(불량이 발생하는 문제)가 커진다는 것을 깨닫고 방향을 완전히 바꿨습니다. 바로 칩렛을 활용한 멀티칩 모듈로 말입니다.
AMD는 하나의 칩에 모든 구성요소를 다 새길 필요가 없다고 생각하고 각각의 기능을 담당하는 더 작은 구조인 칩렛에 집중했습니다. 잘게 쪼갠 칩렛들을 최종 제품 사양에 맞게 배치하기만 하면 되니까, 고사양 제품은 더 많은 수를 배치하고, 저사양 제품은 적은 수를 배치하면 되는 것입니다. 모놀리식 구조는 거대한 구조의 어느 한 부분이 불량이면 전체를 못 쓰게 되는 문제가 생기지만, 칩렛을 이용하는 멀티칩 모듈은 훨씬 작은 크기의 칩렛만 교체하면 되니까 불량에서 상대적으로 훨씬 자유롭습니다. 덕분에 생산 단가를 절약할 수 있고, 고사양 제품을 손쉽게 만들 수 있는 장점이 있습니다. AMD는 CPU에서 확실히 검증된 칩렛과 멀티칩 모듈의 장점을 이제 그래픽카드에도 적용하려는 생각인 것 같습니다.
3. 칩렛과 멀티칩 모듈이 좋은 건 알지만 GPU에 적용하는 건 어렵다
칩렛을 활용한 멀티칩 모듈이 효율적이고 좋다는 것은 제조사들이 이미 예전부터 알고 있었겠지만, 문제는 여러 개의 칩렛을 하나의 GPU처럼 인식시켜야 하고, 여러 개의 칩렛이 마치 하나의 GPU인 것처럼 손발을 맞춰야 한다는 것입니다.
우리는 이미 과거에 듀얼 GPU 그래픽카드(라데온 HD6990 등)와 듀얼 그래픽카드 기술(SLI, CF)이 실패하는 모습을 보아왔는데요. 두 개의 머리(2 GPU)가 각각 연산한 결과물을 하나로 합치는 과정에서 많은 문제들이 발생했습니다. 메모리 동기화에 실패하면 화면의 위 아래가 따로 놀아서 화면이 찢어지거나, 또는 애초에 게임에서 두 개의 GPU를 인식을 못 하는 등의 문제들이 있어왔죠.
겨우 두 개의 GPU를 하나처럼 연동시키는 것도 이정도로 힘든데, 수 많은 칩렛을 하나처럼 연동시키는 것은 더욱 힘들겠지요. 그래서 그동안은 그래픽카드 시장에서 듀얼 GPU 그래픽카드가 사라졌고, SLI/CF도 점점 존재감이 사라졌으며, 어떤 제조사도 칩렛 구조를 그래픽카드에 도입할 엄두를 못 냈습니다.
4. AMD는 라이젠 프로세서를 만들듯 GPU도 만들 계획일까?
최근 칩렛을 활용한 멀티칩 모듈 : 라이젠으로 재미를 본 AMD라면 어떨까요? 이번 특허에서 AMD가 내놓은 해결방법은 고대역폭 패시브 크로스링크라는 것입니다.
1번 이미지를 보면 CPU와 시스템 메모리, 그리고 GPU 칩렛 106-1이 서로 화살표로 연결되어 있는데요. 그 옆에 있는 106-2 칩렛부터는 CPU와 메모리와 다이렉트로 연결되지 않습니다. 대신에 칩렛끼리만 서로 연결되어 있습니다. 이 방법, 어디서 많이 본 것이죠? 마치 라이젠 프로세서에서 CCX와 IF의 관계를 보는 듯합니다. 라이젠 프로세서는 IF를 거치다 보니 그만큼 딜레이가 생기고 IF의 동작 속도에 한계가 있어서 거기에서 오는 몇 가지 소소한 단점들이 있었는데, 시간이 흐르면서 점차 개선되는 모습을 보여줬습니다. 먼 미래에 나올 GPU는 이런 단점을 더욱 보완했을 것으로 예상해볼 수 있겠습니다.
이때 핵심이 되는 것은 위 그림(캐시메모리 계층구조)에서 HBX PASSIVE CROSSLINK 라고 되어있는 것입니다. 라이젠 프로세서에서 IF와 비슷한 역할을 하는 듯한데, 위 그림을 보면 패시브 크로스링크가 L1 + L2 캐시와 L3 + 그래픽메모리를 중간에서 분리하고 있습니다. 제가 분리라고 말씀드리긴 했지만, 반대로 '연결'이라고 해도 무방할 것입니다. 그러므로 패시브 크로스링크는 각각의 칩렛이 연산한 결과물을 중간에서 가로채서(?), 최종적으로 그 연산 결과를 필요로하는 다른 칩렛에 전달해주는 역할을 하게 될 것으로 보입니다.
결과적으로, 여러 개의 칩렛으로 구성된 멀티칩 모듈 GPU이지만, 위 방식을 사용하면 각 칩렛을 유기적으로 묶어서 데이터의 일관성을 유지할 수 있다는 것이 AMD가 이번 특허에서 주장하는 내용입니다. 시스템이나 소프트웨어도 이 GPU를 전통적인 모놀리식 GPU처럼 인식할 수 있다고 하네요.
모놀리식 구조를 버리고 칩렛을 활용한 구조로 넘어가는 것은 AMD만의 독자적인 방식은 아닙니다. 인텔도 차세대 그래픽카드인 Xe-HP를 이와 유사한 방식으로 제작하는 것으로 알려져 있고, 엔비디아 또한 멀티칩 모듈 방식의 GPU를 설계한다는 루머가 있습니다. 몇 년 후에는 모든 그래픽카드가 멀티칩 모듈 방식의 GPU를 탑재할 것 같기도 합니다.
일련의 트렌드에 대한 회원 여러분들의 생각은 어떠신가요? 라이젠 프로세서가 큰 성공을 거둔 것처럼 그래픽카드에서도 이런 방법이 성공할 수 있을까요? 아래에 댓글로 여러분의 의견을 남겨주십시요. 저는 다음 시간에 더 재미있는 소식으로 인사드리겠습니다.