엔비디아와 소프트뱅크가 일본 내 인공지능(AI) 생태계에서 혁신을 지원할 일본 최대 규모의 ‘AI 슈퍼컴퓨터’ 구축에 나선다. 소프트뱅크는 이 시스템의 구축을 위해 세계 최초로 ‘엔비디아 DGX B200’ 시스템을 구축받을 계획이다.

엔비디아는 13일(현지시각) 일본 도쿄에서 열린 ‘엔비디아 AI 서밋 일본 2024’의 기조연설을 통해 소프트뱅크와 일본에서 가장 강력한 AI 슈퍼컴퓨터를 구축하고 있다고 발표했다. 이번에 구축되는 시스템은 AI에서 25엑사플롭스(EFlops) 연산 성능을 제공할 것으로 기대된다. 

엔비디아와 소프트뱅크는 이 시스템 외에도 극도로 컴퓨팅 집약적인 워크로드를 위한 또 다른 ‘그레이스 블랙웰(GB:Grace Blackwell)’ 플랫폼 기반 가속 슈퍼컴퓨터를 구축할 계획이다. 또한 통신 네트워크에도 AI-RAN(Radio Access Network) 구현 등에서 협력하고 있으며 통신 사업자들의 기지국을 AI 수익 창출 자산으로 전환할 수 있는 기회를 제공한다고 밝혔다.

젠슨 황 엔비디아 CEO / 엔비디아 영상 갈무리
젠슨 황 엔비디아 CEO / 엔비디아 영상 갈무리
엔비디아와 소프트뱅크가 ‘AI 슈퍼컴퓨터’ 구축을 공식 발표했다. / 엔비디아 영상 갈무리
엔비디아와 소프트뱅크가 ‘AI 슈퍼컴퓨터’ 구축을 공식 발표했다. / 엔비디아 영상 갈무리

새로운 AI 슈퍼컴퓨터, 앞으로의 AI 혁신 지원할 ‘AI 팩토리’ 

젠슨 황 엔비디아 CEO는 이번 ‘엔비디아 AI 서밋 일본 2024’의 기조연설을 통해 “AI 시대의 혁신은 ‘인텔리전스’를 만드는 것이다. 컴퓨트에서 시작된 영향력은 이제 모든 산업군에 전해지고 있다”고 말했다. 소프트뱅크와 함께 구축하는 ‘AI 슈퍼컴퓨터’는 일본에서 가장 높은 성능을 갖춘 시스템이자 ‘일본에서 가장 큰 AI 팩토리’라고 소개했다.

이 시스템은 엔비디아의 DGX를 기반으로 한다. 소프트뱅크는 시스템 구축을 위해 세계 최초로 엔비디아의 DGX B200 시스템을 공급받을 예정이다. 이 시스템이 구축되면 일본에서 가장 뛰어난 성능을 발휘할 것으로 기대된다. 엔비디아의 퀀텀-2 인피니밴드 네트워킹과 AI 엔터프라이즈 소프트웨어 환경을 갖춰 거대언어모델(LLM) 개발에도 이상적이다.

젠슨 황 CEO는 “이 시스템은 AI에서 25엑사플롭스 성능을 제공할 것이다. 현재 세계 최대 슈퍼컴퓨터의 연산 성능이 1 엑사플롭스 급이다”라고 말했다. 물론 현실적으로는 데이터 유형이 다르기 때문에 양 쪽의 연산 성능 수치를 직접 비교할 수는 없다. 

소프트뱅크는 자체 생성형 AI 개발과 AI 관련 사업뿐만 아니라 일본 전역의 대학, 연구 기관, 기업에서 ‘블랙웰’ 기반 DGX 슈퍼팟(SuperPOD)을 사용할 계획이다. 소프트뱅크는 이 외에도 극도로 컴퓨팅 집약적인 워크로드를 위한 다른 엔비디아 기반 가속 슈퍼컴퓨터를 구축할 계획으로 알려졌다. 이 시스템은 엔비디아의 ‘그레이스 블랙웰’ 플랫폼 설계를 기반으로 하고 있다. 

기지국서 AI 워크로드를 직접 운영하는 ‘AI-RAN’ 사례가 소개됐다. / 엔비디아 영상 갈무리
기지국서 AI 워크로드를 직접 운영하는 ‘AI-RAN’ 사례가 소개됐다. / 엔비디아 영상 갈무리

AI 슈퍼컴퓨터가 AI를 만드는 ‘AI 팩토리’라면 이를 사용자에까지 전달하는 것은 ‘네트워크’다. 엔비디아와 소프트뱅크는 이러한 ‘AI 네트워크’에 대해서도 AI와 5G 워크로드를 동시에 실행할 수 있는 새로운 유형의 통신 네트워크를 개발하는 기술 구현에서 중요한 지점에 이르렀다고 발표했다. 

엔비디아와 소프트뱅크가 발표한 ‘AI-RAN’은 기지국 수준의 인프라에서 AI와 5G 네트워크 워크로드를 동시에 처리해 기지국을 AI를 통한 수익 창출이 가능한 자산으로 전환할 수 있게 할 것으로 기대된다. 엔비디아와 소프트뱅크는 ‘AI-RAN’인프라의 투자 가치로, 1달러를 투자할 때마다 약 5달러의 AI 추론 수익을 얻을 수 있을 것으로 예상한다. 운영 비용과 자본 비용을 고려하면 인프라에 추가하는 AI-RAN 서버에 대해 최대 219% 수익을 기대했다.

소프트뱅크는 이 ‘AI-RAN’에서 자율주행차의 원격 지원, 로보틱스 제어, 엣지에서의 멀티모달 검색 자동 생성 등의 실제 AI 추론 애플리케이션을 구현했다. 모든 추론 워크로드가 소프트뱅크의 AI-RAN 네트워크에서 최적으로 실행될 수 있었다고 밝혔다. 한편 소프트뱅크의 AI-RAN 솔루션 실험에는 엔비디아와 소프트뱅크와 함께 후지쯔와 레드햇이 참여했다.

젠슨 황 CEO는 “AI 팩토리가 AI를 만들면 이를 전달하는 것은 ‘AI 그리드’다. AI가 결합된 무선 네트워크는 통신 네트워크의 AI 혁신을 이끌고 새로운 유형의 인텔리전스를 전달할 것이다. 이는 새로운 산업과 경제 구조의 구축 등 새로운 혁신이 만들어지는 기회가 될 것이다”라고 말했다.

엔비디아 ‘그레이스 블랙웰’을 소개하는 젠슨 황 CEO / 엔비디아 영상 갈무리
엔비디아 ‘그레이스 블랙웰’을 소개하는 젠슨 황 CEO / 엔비디아 영상 갈무리

같은 기술에서 파생되는 AI의 두 가지 ‘방향성’

젠슨 황 CEO는 이 자리에서 “우리가 제시하는 ‘가속 컴퓨팅’은 CPU를 대체하는 것이 아니라 각 구성 요소들에 적합한 연산을 적합한 형태로 처리하는 것”이라며 “이는 컴퓨팅 모델에 근본적인 변화를 불러오면서 새로운 시대를 열고 있다”고 말했다. 엔비디아는 다양한 산업군을 위한 라이브러리들을 선보이며 GPU의 활용도를 지속적으로 넓히고 있다고 덧붙였다.

오늘날 ‘멀티모달’은 AI의 가능성을 무한하게 넓히는 근간이 됐다. 젠슨 황 CEO는 “이제 멀티모달 모델을 통해 데이터의 의미를 파악하는 것을 넘어 이를 연결, 전환하고 생성하는 것까지 가능해졌다”고 말했다. 이어 “다양한 조합으로 새로운 사례가 만들어질 수 있으며 지금은 시작일 뿐이다”라고 말했다.

이러한 발전에 따라 컴퓨팅 성능 요구도 빠르게 늘고 있으며 이를 지원하기 위해 성능을 높이면서 에너지 소비와 비용은 낮추는 효율 개선의 발전 방향이 필요하다고 제시했다. 또한 “AI는 단지 칩의 문제가 아니라 ‘시스템’으로 접근해야 한다”며 “블랙웰은 GPU의 명칭이자 시스템 구성의 명칭이기도 하다”고 말했다.

엔비디아의 ‘블랙웰’ GPU는 두 개의 ‘블랙웰’ 다이와 8개의 HBM3e 메모리가 연결돼 구성된다. 모듈 단위로는 두 개의 블랙웰 GPU와 한 개의 그레이스 CPU가 결합돼 ‘그레이스 블랙웰’이 된다. 이 모듈 또한 다른 모듈과 NV링크(NVLink)로 연결돼 랙 단위로 확장될 수 있다. 이러한 구성이 ‘GB200 NVL72’다. 젠슨 황 CEO는 “블랙웰은 슈퍼컴퓨터부터 엣지까지 다양한 규모로 적용 가능한 유연성을 갖췄다”고 언급했다.

엔비디아 ‘옴니버스’는 물리적 AI 구현에서 ‘시뮬레이션’의 핵심 요소다. / 엔비디아 영상 갈무리
엔비디아 ‘옴니버스’는 물리적 AI 구현에서 ‘시뮬레이션’의 핵심 요소다. / 엔비디아 영상 갈무리

젠슨 황 CEO는 향후 AI의 유형에 대해 크게 ‘디지털’과 ‘물리적’의 두 가지로 분류했다. 이 중 ‘디지털’ AI는 주어진 일을 처리하는 현재의 ‘워커’에서 ‘에이전트’로 변화하고 다양한 에이전트들이 연결될 것이라 제시했다. 또한 “엔비디아는 이 AI 에이전트 시대를 위한 솔루션을 제공하지는 않지만 이를 가능하게 하는 생태계의 기반 기술을 제공한다”며 AI 에이전트의 라이프사이클 전반을 지원하는 네모(NeMo) 라이브러리를 언급했다.

또한 젠슨 황 CEO는 “어느 에이전트도 100%를 해 줄 수는 없다. 하지만 50% 정도만 해 줘도 우리에게는 크게 도움이 될 것이다”라며 “AI가 사람의 직업을 대체하지는 않을 것이다. 하지만 ‘AI를 잘 활용하는 사람’이 당신의 자리를 대체할 수는 있을 것이다” 라고 말했다.

‘물리적’ AI는 ‘디지털’과 기반 기술은 같지만 기계적인 시스템에 적용된다는 점이 다르며 흔히 ‘산업용 AI(Industrial AI)’로 표현된다. 모델의 훈련과 시뮬레이션, 실제 로봇에 적용으로 이어지는 물리적 AI의 라이프사이클에서는 시뮬레이션을 제공하는 엔비디아 ‘옴니버스 (Omniverse)’ 플랫폼의 중요성을 강조했다.

젠슨 황 CEO는 “물리적 AI에서도 명령에 대한 모션을 AI로 생성하는 것도 생성형 AI 콘셉트의 일부로 볼 수 있다. 이런 부분이 옴니버스와 생성형 AI가 로봇 기술로 연결될 수 있는 이유다”라고 말했다.

권용만 기자 yongman.kwon@chosunbiz.com

관련기사