최근 일본 문부과학성은 총 사업비 1200억 엔(약 1조3천억 원)을 투입해 엑사급 컴퓨터인 'Post K'를 개발하는 계획을 확정했다. 또한 미국 에너지성은 14억 달러(약 1조5천억 원)의 엑사급 컴퓨터 개발계획을 수립했다. 이렇게 주요선진국들이 막대한 자금을 투입하여 2020년 전후로 개발하고자 하는 엑사급 컴퓨터란 도대체 무엇인가?
엑사급 컴퓨터는 1초에 무려 100경회의 연산을 수행하는 엑사플롭스(ExaFLOPS)의 계산능력을 보유한 시스템을 말한다. 현재 세계에서 가장 빠른 중국 은하2호의 실측성능이 34 PF(페타플롭스)이니 엑사급 슈퍼컴퓨터의 계산능력은 이의 30배가 넘는다. 참고로 1 EF은 1000 PF에 해당한다.
그렇다면 이렇게 거대한 슈퍼컴이 왜 필요할까? 예를 들어 항공기 설계과정을 살펴보자. 지난 수십 년간 항공기 제조사들은 컴퓨터 시뮬레이션을 이용해 제품설계의 비용 및 기간을 대폭 단축할 수 있었다. 그러나 정체된 설계 효율성을 개선하기 위해서는 보다 정교한 방정식을 다루어야 하며, 이를 위해서는 엑사급의 슈퍼컴퓨터가 필수적이다.
인간의 뇌를 컴퓨터로 재현하여 치매 등 뇌 질환의 치료법을 제시하려는 HBP(Human Brain Project)에도 엑사급 컴퓨터가 사용된다. 또한 지구온난화를 정확하게 예측하고, 원하는 특성을 가진 새로운 물질을 개발하며, 초신성의 폭발 같은 우주의 신비를 이해하는 데에도 엑사급 슈퍼컴퓨터는 필수적인 도구이다.
그렇다면 엑사급 슈퍼컴을 구현하기 위한 방법은 어떤 것이 있으며 넘어야 할 기술적 문제들은 어떤 것이 있을까? 현재 추진되는 대표적인 방법으로는 (1)일반적 CPU에 의존하는 '멀티코어(multi-core) 방법' (2)많은 코어를 가지는 CPU를 사용하는 '메니코어(many-core) 방법' (3)GPU 등의 가속기를 활용하는 '가속기 방법' 등을 꼽을 수 있다.
멀티코어 방법 대표적인 사례로 현재 일본 최고의 슈퍼컴인 'K Computer'를 들 수 있다. 여기에는 8개의 코어로 이루어진 SPARC64 CPU를 8만8128개 이용해 실측성능 11PF를 구현하였다. 미국 과학재단의 대표적 슈퍼컴퓨터인 'Blue Waters' 시스템도 이 부류에 속한다.
![]()
<사진:일본 최고의 K Computer: 일본 이화학연구소에서 운영하고 있으며, 8만8128개의 서버용 CPU인 SPARC64를 사용하여 11페타플롭스의 실측 성능을 구현했다 (출처: 일본 이화학연구소 Hirao 박사)>
메니코어 방법의 대표적인 사례는 미국 로렌스 리버모어 국립연구소에서 운영하는 세계 3위 슈퍼컴인 'Sequior' 시스템이다. 저전력 16코어 PowerPC CPU가 9만8304개 탑재되어 17PF의 실측성능에 도달하였다.
<사진:미국 에너지성의 Sequoir 슈퍼컴퓨터: 세계 3위의 시스템으로 16코어 PowerPC 저전력 CPU를 이용하여 17페타플롭스의 실측성능에 도달하였다 (출처: 미국 버클리국립연구소 Simon 박사)>
가속기 방법의 시스템으로는 세계 최고 슈퍼컴 중국 은하2호를 들 수 있다. 3만2천 개의 12코어 제온 CPU외에 4만8천 개의 57코어 제온 파이를 사용해 무려 34PF이 실측 성능에 도달했다. 또한 미국 최고의 슈퍼컴인 타이탄은 1만8688개의 16코어 Opteron CPU 외에도 같은 수의 2500코어 Tesla GPU를 보조연산장치로 이용하여 18PF의 성능을 구현하였다.
<사진:중국의 은하2호 시스템: 세계최고 슈퍼컴으로 3만2천개의 Xeon CPU외에 보조연산장치로 4만8천개의 Xeon Phi를 활용하여 실측성능 34페타플롭스에 도달하였다. 전력소모는 무려 18MW에 이른다 (출처: 중국 국방과학기술대학 Lu 교수)>
그러나 이러한 방법으로 엑사급 시스템을 구현하는 데에는 넘어야 할 장벽이 너무도 많다. 그 첫째가 에너지 효율성이다. 현실적인 운영에 대한 비용 등을 고려하여 슈퍼컴 시스템의 전력소모를 20MW 이내에 맞추어야 한다. 은하2호의 전력소모가 18MW이니 에너지 효율성이 25배 이상 개선되어야 하는 것이다.
데이터 이동도 심각한 문제이다. 현재 메모리에서 CPU로 데이터를 옮기는데 필요한 시간은 CPU에서 계산을 수행하는데 필요한 시간의 100배에 이르며, 하드디스크의 경우 1만 배에 이른다. 앞으로 CPU의 계산능력이 향상되면서 이 격차는 더 벌어질 것으로 예상되기 때문에, 이를 해결하기 위해서는 근본적인 고려가 필요하다.
또 다른 문제는 시스템의 안정성이다. 미국의 타이탄 시스템의 경우 시스템 전체에 영향을 미치는 장애가 평균적으로 하루에 1회 발생하는 것으로 알려져 있다. 이를 기준으로 하면 엑사급 시스템에 장애가 발생하는 주기는 25분에 불과하다. 따라서 사용 가능한 엑사급 시스템을 위해서는 100배 이상의 안정성 개선이 필요하다.
엑사급 슈퍼컴퓨터 시스템을 구현하는데 넘어야 할 장벽은 끝이 없으며 일견 불가능해 보이기까지 한다 하지만 엑사급 컴퓨터가 가져올 막대한 사회경제적 효과와 이를 국가경쟁력의 핵심으로 인식하여 대규모 투자를 하고 있는 선진국의 움직임으로 보면 2020년 초에는 엑사급 시스템이 구현되리라 예상한다.
|
<이지수 소장 약력> -미 보스턴대학 물리학 박사 -독일 국립슈퍼컴센터 연구원 -한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅센터 센터장 -(사)한국계산과학공학회 부회장 -Journal of Computational Science 편집위원 -(현재) KISTI 국가슈퍼컴퓨팅연구소 소장 |








