[이지수 소장의 수퍼컴퓨터 이야기] ISC18, 미국 슈퍼컴 왕좌 탈환하나

  • 이지수 소장
    입력 2018.06.12 15:42

    중국의 첨단기술은 빠르게 발전했다. 지난 8월 세계 최초로 양자통신 위성을 쏴 올렸고, 지난해 9월에는 지름 500m의 세계 최대 우주관측용 망원경도 설치했다.
    첨단기술의 상징이라 할 수 있는 슈퍼컴퓨터도 예외가 아니다. 세계 대표 슈퍼컴 500대 정보를 정리한 톱500에 따르면 현재 중국 슈퍼컴 점유율은 40.4%다. 미국의 28.6%를 훨씬 앞선다.

    세계 1위 슈퍼컴 자리도 2013년 6월 이후로 계속 중국이 차지했다. 지난 10년을 살펴봐도 중국이 11회, 미국이 7회, 일본이 2회 슈퍼컴 왕좌의 자리를 차지했다. 참고로 톱500 순위는 1년에 두 번 발표된다.

    ◇美, 슈퍼컴 1위 탈환하나

    미국은 세계 1위 슈퍼컴퓨터 자리를 탈환할 수 있을까?

    미국이 내세운 후보는 ‘코랄(CORAL, Collaboration of Oak Ridge, Argonne, and Lawrence Livermore)사업’으로 구축된 오크리지 국립연구소의 써미트(Summit)와 리버모어 국립연구소의 시에라(Sierra) 시스템으로 미국의 회심작이다. 2014년에 구축 계획이 승인됐으니 무려 4년을 준비한 셈이다.

    써미트(Summit) 슈퍼컴퓨터 / 미국 오크리지 국립연구소 제공
    써미트 시스템은 이론성능 207 페타플롭스(PetaFLOPS)로 현재 세계 1위인 중국 ‘타이후라이트(TaihuLight)’ 슈퍼컴의 125 페타플롭스를 훨씬 상회한다. 메모리는 2.4 페타바이트(PetaByte), 디스크는 250 페타바이트며 15메가와트(MW)의 전력이 필요하다. 가격은 2억1400만달러(2290억원)로 알려졌다.

    전체 시스템은 4600개 노드(Node)로 구성된다. 각 노드에는 2개의 IBM Power9 CPU와 6개의 엔비디아(Nvidia) 볼타(Volta) GPU가 탑재됐다. 이들은 고속 네트워크인 NVLink 2.0으로 연결된다. 각 노드는 멜라녹스(Mellanox) 인피니밴드(Infiniband) EDR(Enhanced Data Rate) 스위치로 연결된다.

    시에라 시스템 구조는 기본적으로 써미트와 같다. 주요 차이점은 노드에 장착된 GPU가 4개다. 이론성능은 125 페타플롭스, 전력소모는 12MW, 가격은 1억3300만달러(1423억원)로 추정된다.

    시에라(Sierra) 슈퍼컴퓨터 구성 / 미국 리버모어 국립연구소 제공
    두 시스템 GPU 수가 다른 것은 연구소 특성 때문이다. 오크리지 국립연구소는 현재 주력 슈퍼컴인 타이탄(Titan)에 GPU가 탑재돼 있어 사용자가 이에 익숙하다. 반면 리버모어의 주력 세콰이어(Sequoir)는 IBM 블루진(BlueGene) 시스템으로 GPU 사용경험이 많지 않다.

    ◇ 中 히든카드 먹힐까

    중국은 어떤 카드를 준비하고 있을까?

    현재 세계 2위 텐허(Tianhe)-2를 업그레이드한 텐허-2A 슈퍼컴의 등장이 예상된다. 텐허-2A는 인텔 나이츠 코너(Knights Corner) 가속기를 나이츠 랜딩(Knights Landing)으로 업그레이드 할 계획이었다. 하지만 미국이 슈퍼컴 핵심부품의 중국판매를 금지하면서 그 계획이 대대적으로 변경됐다.

    텐허2와 텐허2A 비교 / 중국 국방과학기술대 제공
    알려진 바로는 현재 인텔 아이비브릿지(IvyBridge) CPU를 그대로 사용하고 가속기를 자체 개발한 매트릭스(Matrix)-2000으로 대체하며 내부연결망 성능을 개선하는 것이 핵심이다. 이 경우 이론성능은 95 페타플롭스다. 써미트 시스템뿐 아니라 타이후라이트 시스템 성능에도 미치지 못한다.

    하지만 CPU를 차세대 제품인 스카이레이크(Skylake)로 업그레이드 하거나, 노드를 추가하는 방법으로 써미트 성능을 추월하는 것은 기술적으로 가능하다. 다만 미국의 수출금지 조치로 중국이 자체 기술을 강조하는 흐름에서 이러한 업그레이드는 긍정적이지 않다.

    그렇다면 업그레이드 핵심인 매트릭스-2000은 어떻게 생겼을까? 이는 범용 DSP(Digital Signal Processor)에 벡터명령 추가 등의 방법으로 슈퍼컴에 맞게 개량한 제품이다. 칩 하나는 128개 코어(Core)로 구성된다. 전력소모는 240W 이론성능은 2.45 테라플롭스로 추정된다.

    타이후라이트를 업그레이드 하는 것도 생각해볼 수 있다. 하지만 등장한지 2년 밖에 되지 않은 시스템이다. 중국 서버기업 수곤(Sugon)이 AMD 라이선스를 활용해 슈퍼컴을 구축하고 있다는 소문도 있지만 아직은 초기단계로 알려졌다.

    이를 종합하면 미국이 오랜만에 슈퍼컴 왕좌를 탈환할 것으로 예상한다. 하지만 마지막에 중국이 대역전극을 펼칠 가능성도 없지 않다. 세계 톱500 순위 발표가 유독 기대되는 이유다.

    ※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

    이지수 소장은 미국 보스턴대학에서 물리학 박사를 했고 독일 국립슈퍼컴센터 연구원, 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅센터 센터장, 사단법인 한국계산과학공학회 부회장, 저널오브컴퓨테이셔널싸이언스(Journal of Computational Science) 편집위원, KISTI 국가슈퍼컴퓨팅연구소 소장을 거쳐 현재는 사우디 킹 압둘라 과학기술대학교(KAUST) 슈퍼컴센터장을 맡고 있습니다.

    관련기사를 더 보시려면,

    美, 슈퍼컴퓨터 왕좌 되찾나…초당 20경회 연산 구축 노동균 기자