2020년 초까지 엑사급 슈퍼컴을 확보하려는 국가간 경쟁이 본격화되고 있다. 관련 업계는 현재 1위 슈퍼컴을 보유한 중국을 자연스레 승자로 예측했다. 하지만 최근 미국과 일본이 구체적인 개발 계획을 발표하면서 최고의 슈퍼컴을 보유하기 위한 경쟁이 치열하다.

엑사급 컴퓨터는 1초에 100경회의 연산을 수행하는 엑사플롭스(EF, ExaFLOPS)의 계산능력을 보유한 시스템을 말한다. 현재 세계에서 가장 빠른 슈퍼컴퓨터는 중국의 '타이후라이트(TaihuLight)'다. 이 슈퍼컴의 실측 성능은 93 페타플롭스(PetaFLOPS)다. 엑사급 슈퍼컴퓨터의 계산능력은 이의 10배가 넘는 것이다. 참고로 1 EF은 1000 PF에 해당한다

관련 업계가 엑사급 슈퍼컴 분야에서 중국을 승자로 예측하는 것은 중국이 그만큼 슈퍼컴퓨팅 영역에서 기술력을 갖췄다고 판단했기 때문이다.

중국 정부는 2016년 6월, 13차 5개년 국가계획의 일환으로 2020년까지 엑사급 컴퓨터를 자체기술로 개발하겠다고 발표했다. 그 사양은 엑사플롭스 계산 성능, 10 페타바이트(PetaByte) 메모리, 1 엑사바이트(ExaByte) 디스크에 달한다. 전력효율성은 30기가플롭스(GigaFLOPS)/W, 실측성능 효율 60%가 목표다.

중국의 특징은 전체적인 구도와 방향성은 정부 계획에 명시하지만 구체적인 시행은 지자체를 중심으로 비밀리에 진행한다는 점이다. 돌이켜보면 중국이 1위 슈퍼컴퓨터를 발표한 사례들은 모두 '깜짝 쇼'에 가까웠다.

중국이 개발하는 엑사급 시스템은 어떤 모습일까? 이를 추정하기 위해선 중국에 있는 슈퍼컴퓨터 관련 기관들을 중심으로 이들이 개발한 시스템을 살펴볼 필요가 있다.

◆슈퍼컴 개발, 정부가 주도...구체적 실행은 지자체가 맡아

첫 번째로 살펴볼 기관은 중국 국방과학기술대학(NUDT: National University of Defense Technology)이다. 1966년에 개교한 이 학교는 1983년 '갤럭시(Galaxy)' 시스템을 자체 개발했다. 갤럭시 시스템은 당시 대표적 슈퍼컴인 '크레이(Cray)-1'을 벤치마크했다. 또 이 학교는 1992년 '갤럭시-2'를 발표했다. 갤럭시 2는 중국 최초로 1GF의 성능을 구현했다.

NUDT는 2009년 '은하1(Tianhe-1)'으로 세계 5위를 차지했다. 2010년에는 '은하1A(Tianhe-1A)'를 개발해 중국 최초 세계 1위로 올라섰다. 후속작인 '은하2(Tianhe2)' 슈퍼컴은 33PF의 압도적 성능으로 2013년 세계 1위에 등극했으며 현재의 타이후라이트에게 자리를 물려주기까지 3년간 왕좌를 유지했다.

중국의 ‘은하(Tianhe)’ 슈퍼컴퓨터 개발 계획: 중국은 현재 세계 2위인 ‘은하2’ 시스템을 자국에서 개발한 가속기를 사용해 성능을 100PF로 향상시키려 하고 있다. / 중국 국방과학기술대학 루(Lu) 교수 제공
중국의 ‘은하(Tianhe)’ 슈퍼컴퓨터 개발 계획: 중국은 현재 세계 2위인 ‘은하2’ 시스템을 자국에서 개발한 가속기를 사용해 성능을 100PF로 향상시키려 하고 있다. / 중국 국방과학기술대학 루(Lu) 교수 제공
NUDT는 타이후라이트에게 왕좌를 빼앗기 위해 은하2의 후속 시스템을 개발할 계획이었지만 2015년 미국 정부가 슈퍼컴퓨터 핵심부품의 중국판매를 금지하면서 계획을 변경했다.

NUDT는 당초 은하2의 후속에 인텔의 '제온파이(Xeon Phi)' 가속기에 장착된 'NKC(Knights Corner)'를 차기 제품인 'KNL(Knights Landing)'로 교체할 계획이었다. 하지만 NUDT는 KNL을 대신해 DSP(Digital Signal Processor)를 가속기로 활용하는 방안을 검토 중이다. 대표적인 DSP인 '매트릭스(Matrix) 2000'을 이용하면 200W의 전력으로 2.4TF 정도의 성능을 얻을 수 있을 것으로 예상된다.

DSP를 슈퍼컴에 활용하기 위해선 해결해야 할 것들이 있다. DSP는 엔비디아(Nvidia)를 중심으로 추진해온 GPU와 달리 이를 계산에 활용하기 위한 생태계가 형성되지 않았다. 또 산업체에서도 별다른 관심이 없다. 이 때문에 중국은 라이센싱 방법으로 GPU를 자체 생산하는 방안도 검토하고 있다는 소문이다.

CPU는 상황이 더 불확실해 보인다. 미국의 엠바고에 맞서 중국이 자체기술을 강조하는 상황에서 인텔에 계속 의존할 수가 없기 때문이다. 한 가지 가능성은 휴대폰 등 모바일 장비에 광범위하게 사용되는 ARM(Advanced RISC Machine) CPU를 활용하는 것이다. NUDT는 ARM CPU를 슈퍼컴용으로 변환하기 위해 64비트 연산 성능을 개선하고 고성능 메모리를 탑재하는 등의 연구를 진행하고 있다.

또 다른 중국의 기관은 현재 슈퍼컴 분야 1위를 차지하고 있는 타이후라이트를 개발한 '국가병렬컴퓨터연구센터(NRCPC: National Research Center of Parallel Computer Engineering and Technology)'다.
NRCPC는 '알파(Alpha)' 아키텍처를 기반으로 한 '선웨이(Shenwei)' CPU와 이를 탑재한 슈퍼컴퓨터 개발을 추진 중이다. NRCPC는 2006년 싱글코어 '선웨이-1' CPU를 시작으로, 2008년에는 듀얼코어 선웨이-2, 2010년에는 16코어 선웨이-3를 발표했다. 선웨이-3의 후속작인 '선웨이-1600C'는 2011년 세계 14위로 등장한 중국 '블루라이트(BlueLight)' 슈퍼컴에 탑재됐다.

타이후라이트(TaihuLight)는 현재 세계에서 가장 빠른 슈퍼컴퓨터로 중국이 자체 개발한 선웨이-26010 CPU를 사용해 93페타플롭스(PF)의 성능을 자랑한다. / 중국 국가병렬컴퓨터연구센터 제공
타이후라이트(TaihuLight)는 현재 세계에서 가장 빠른 슈퍼컴퓨터로 중국이 자체 개발한 선웨이-26010 CPU를 사용해 93페타플롭스(PF)의 성능을 자랑한다. / 중국 국가병렬컴퓨터연구센터 제공
타이후라이트에 탑재된 선웨이-26010은 CPU의 코어 수가 무려 250개에 이른다. 계산을 전담하는 코어 64개와 이들 코어를 관리하는 코어 1개로 이뤄진 65개가 한 묶음이다. 또 이런 묶음 4개가 모여 CPU를 구성한다.

NRCPC는 아키텍처의 변화 없이 현재 시스템을 개량하는 방법으로 엑사급 슈퍼컴퓨터에 도전하고 있다.

마지막으로 중국에서 엑사급 슈퍼컴퓨터를 개발하는 곳은 중국 제일의 고성능컴퓨터 기업인 '수곤(Sugon)'이다. 수곤은 중국 과학원 산하 '계산기술연구소(ICT: Institute of Computing Technology)'에서 다우닝(Dawning)으로 창업하였고 후에 명칭을 수곤으로 바꿨다.

중국 최초의 슈퍼컴 757은 중국과학원 계산기술연구소에서 1983년에 발표한 시스템으로 자체 개발한 벡터형 CPU를 사용해 10메가플롭스(MF)의 성능을 구현했다. / 중국 계산기술연구소 제공
중국 최초의 슈퍼컴 757은 중국과학원 계산기술연구소에서 1983년에 발표한 시스템으로 자체 개발한 벡터형 CPU를 사용해 10메가플롭스(MF)의 성능을 구현했다. / 중국 계산기술연구소 제공
수곤은 1983년 중국 최초의 슈퍼컴 '757 시스템'을 개발했다. 1995년 인텔 CPU를 기반으로 2GF 성능의 다우닝(Dawning)1000과 20GF의 다우닝2000, 400GF의 다우닝3000을 거쳐, 2001년에는 AMD CPU 기반의 11TF 성능인 다우닝4000을 개발해 중국 최초로 세계 10위에 도달했다.

현재 수곤은 AMD의 차세대 CPU인 젠(Zen)을 라이센싱해 중국에서 직접 생산한 후 이를 장착한 슈퍼컴을 개발하고 있는 것으로 알려졌다.

이지수 소장은 미국 보스턴대학에서 물리학 박사를 했고 독일 국립슈퍼컴센터 연구원, 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅센터 센터장, 사단법인 한국계산과학공학회 부회장, 저널오브컴퓨테이셔널싸이언스(Journal of Computational Science) 편집위원, KISTI 국가슈퍼컴퓨팅연구소 소장을 거쳐 현재는 사우디 킹 압둘라 과학기술대학교(KAUST) 슈퍼컴센터장을 맡고 있습니다.

관련기사