엑사급 슈퍼컴퓨터는 1초에 100경회 연산을 수행하는 엑사플롭스(ExaFLOPS) 계산능력 시스템을 말한다. 현재까지 세계에서 가장 빠른 슈퍼컴은 미국 오크리지 국립연구소 써미트(Summit)다. 실측성능이 149페타플롭스(PetaFLOPS)다. 엑사급 시스템 계산능력은 이의 6배가 넘는 셈이다. 참고로 1EF은 1000PF에 해당한다

2020년대 초를 목표로 엑사급 슈퍼컴을 확보하려는 미국, 중국, 유럽연합, 일본 간 경쟁이 본격화 되면서 그 후보들의 윤곽이 보이기 시작한다. 과연 최초의 엑사급 슈퍼컴 영광은 어느 나라가 차지하게 될까?

◇ 아르곤 국립 연구소, 美 최초 엑사급 슈퍼컴 도입하나

미국 후보들부터 살펴보자. 첫번째는 2021년 말 아르곤 국립연구소에 설치될 예정인 A21 시스템이다. 아르곤 국립연구소는 당초 인텔 제온 파이(Xeon Phi) CPU와 옴니패스(Omni-Path) 내부연결망을 기반으로 200PF 성능의 오로라(Aurora) 시스템을 2018년 구축할 계획이었다. 하지만 엑사플롭스급 A21 구축으로 변경했다. 이를 이유로 A21은 이론성능 기준 미국 최초의 엑사급 컴퓨터가 될 전망이다.

A21 가격은 5억달러(약 6000억원)다. 크레이(Cray) 샤스타(Shasta) 시스템이 기본이다. CPU는 인텔 차기작 아이스레이크(Icelake) 후속 제품이 될 전망이다. 가속기는 인텔이 개발 중인 Xe가 사용될 것으로 알려졌다. 내부연결망은 크레이 슬링샷(Slingshot)을 사용한다.

두번째 시스템은 2022년 초 설치 예정인 오크리지 국립연구소 프론티어(Frontier) 시스템이다. 시스템 가격은 6억달러(약 7300억원)다. 역시 크레이 샤스타 시스템에 기반하며 슬링샷 내부연결망을 사용한다. 이론성능은 1.5EF를 넘을 것으로 예상된다.

각 노드는 1개 CPU와 4개 GPU가 인피니티 패브릭(Infinity Fabric)으로 연결된다. CPU는 AMD 차기작 밀라노(Milan) 후속제품이 탑재되며 GPU는 AMD 차기작 MI100 후속제품이 사용될 것으로 추정된다.

마지막으로 로랜스 리버모어 국립연구소가 2022년 말 설치할 엘카피탄(El Capitan) 시스템이다. 프론티어와 같이 크레이사 샤스타 시스템과 슬링샷 내부연결망을 사용한다. 이론성능은 1.5EF를 넘을 것으로 예상된다.

미국 최초 엑사급 시스템은 A21이 될 가능성이 높다. 하지만 프론티어 설치시점과 차이가 길지 않아 프론티어가 먼저 가동할 가능성도 배재할 수 없다.

◇ 中, 美보다 먼저 엑사급 슈퍼컴 도입 가능할까

다음은 중국 상황을 살펴보자. 2016년 6월 중국 정부는 13차 5개년 국가계획 일환으로 엑사급 컴퓨터를 2020년까지 ‘통제 가능한’ 기술로 개발하겠다고 발표했다. 중국은 미국 기술 제재 영향으로 첨단제품의 자체 기술을 강조하는 흐름을 보인다.

시스템 사양은 엑사플롭스 이론 성능, 10 페타바이트(PetaByte) 메모리, 1엑사바이트(ExaByte) 디스크다. 내부연결망 대역폭은 400G가 목표다. 현재 3개 제안이 제출돼 선정 작업이 한창이다. 시스템 가격은 3억5000만달러(약 4300억원)에서 5억달러(약 6000억원)로 추정된다.

제안된 3가지 중 하나는 현재 세계 3위 시스팀인 썬웨이 타이후라이트(Sunway TaihuLight) 후속작인 썬웨이 2020이다. 국가병렬컴퓨터연구센터(National Research Center of Parallel Computer Engineering and Technology)가 개발한 알파(Alpha) 아키텍처 기반 선웨이(Shenwei) CPU를 사용한다. 타이후 라이트에 사용된 썬웨이-26010 CPU 대비 3~4배 성능이 개선된 차기작이 사용될 것으로 예상된다. 내부연결망 대역폭은 200G로 추정된다.

두번째는 세계 4위 은하2A(Tianhe2) 슈퍼컴 후속작 은하3(Tianhe3)다. 하나의 노드에 8개 CPU와 8개 가속기가 탑재될 예정이다. 가속기는 DSP(Digital Signal Processor)구조로 은하2A에 사용된 매트릭스(Matrix) 2000을 개량한 매트릭스 3000이 예상된다. CPU에 대한 공식발표가 없으나 ARM을 사용할 것으로 추측된다.

마지막은 세계 3위 슈퍼컴기업 수광(Sugon)이 개발한 수광 엑사스케일(Sugon Exascale 시스템이다. 각 노드는 하이곤(Hygon) 제품인 2개 CPU와 2개 DCU 가속기로 구성된다. CPU는 AMD 에픽(EPYC) 제품을 라이센스 생산하는 형태다.

중국은 미국에 앞서 이론성능 기준 엑사급 컴퓨터를 2020년에 구축할 가능성이 높다. 하지만 여러 변수가 있기 때문에 진행을 자세히 지켜볼 필요가 있다.

◇ 日, 2021년 세계서 가장 비싼 슈퍼컴 도입

일본은 2021년 구축을 목표로 K 컴퓨터 후속작인 후가쿠(Fugaku) 슈퍼컴 개발을 활발히 진행하고 있다. 시스템 개발 예산은 무려 1100억엔(약 1조2000억원)이다. 세계에서 가장 비싼 슈퍼컴이다. 이론성능은 1EF에 근접한 걸로 알려졌다.

CPU는 후지쯔(Fujitsu)가 개발한 ARM기반 A64FX를 사용한다. 실수연산 처리능력을 높이기 위해 SVE(Scaleble Vector Extension)를 추가하고, 고성능 메모리를 탑재한다. 내부연결망도 CPU에 내장하는 걸로 알려졌다.

◇ 유럽, EU 개발 CPU 사용한 슈퍼컴 도입

유럽은 2023~2024년 구축을 목표로 엑사급 컴퓨터 계획을 추진한다. 각 시스템 가격은 3억달러(약 3600억원) 정도로 예상된다. 특이한 점은 구축되는 시스템 중 하나는 반드시 유럽연합에서 개발한 CPU를 사용해야 한다.
EPI(European Processor Initiative)를 중심으로 ARM에 기반한 레아(Rhea) CPU는 2021년에, 크로노스(Cronos)는 2022~3년 개발한다는 목표다. 또한 EPAC이라는 RISC-V기반 가속기를 함께 개발한다.

유럽은 기존에도 자체 기술에 관심을 보였지만 이처럼 대규모 투자는 처음이다. 자체 CPU를 확보하려는 노력은 변화하는 국제정세에서 미국 의존도를 줄이려는 의도로 풀이된다. 다만 비용이 만만치 않다. 유럽연합에서 1억2000유로(약 1600억원), 기업체에서 1억유로 (약 1400억원)을 개발에 직접 투자한다. 추가로 시스템 구입에 10억유로(약 1조4000억원)가 필요하다.

빠르면 내년에 등장할 엑사급 컴퓨터의 최종 승자는 누가될까? 중국이 현재 일정을 지켜 영광을 차지할 수 있을까? 일본이 추가 노력으로 엑사급에 도달할수 있을지 등의 여부에 관심이 쏠린다.

※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

이지수 소장은 미국 보스턴대학에서 물리학 박사를 했고 독일 국립슈퍼컴센터 연구원, 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅센터 센터장, 사단법인 한국계산과학공학회 부회장, 저널오브컴퓨테이셔널싸이언스(Journal of Computational Science) 편집위원, KISTI 국가슈퍼컴퓨팅연구소 소장을 거쳐 현재는 사우디 킹 압둘라 과학기술대학교(KAUST) 슈퍼컴센터장을 맡고 있습니다.

관련기사