생성형 인공지능(AI) 시대가 본격화되면서 전 세계적으로 가장 큰 관심이 몰린 업체를 꼽으라면 단연 ‘엔비디아’일 것이다. ‘챗GPT’ 등장 이후 큰 연산량이 필요한 생성형 AI 워크로드를 거의 유일하게 현실적인 수준으로 소화할 수 있었던 엔비디아의 그래픽처리장치(GPU) 수요는 폭증했고 실적과 주가도 그만큼 올랐다. 멀리 갈 것도 없이 딱 1년 전만 해도 업계에서도 엔비디아의 ‘대안’을 언급하면 그런 것은 ‘불가능’하다는 이야기를 들을 정도였다.
하지만 지금은 어떨까? 이제 시장은 본격적으로 엔비디아의 ‘대안’을 맞이할 준비를 하고 있다. 델은 자사의 연례 행사 ‘델 테크놀로지스 월드’에서 엔비디아 뿐만 아니라 인텔과 AMD 버전의 ‘AI 팩토리’를 준비했다. 사실 델은 이전부터 주력 GPU서버 모델에 AMD와 인텔 칩 기반 옵션을 제공해 왔다. 이를 넘어 이제는 모든 스택이 갖춰진 ‘AI 팩토리’도 제조사별로 갖춘다는 전략이다. 1년 전만 해도 이 ‘AI 팩토리’라는 말이 엔비디아의 전유물일 줄 알았는데 그렇지도 않게 됐다.
‘AI 팩토리’는 서비스를 위한 인프라 하드웨어와 소프트웨어, 지원 스택 등이 긴밀하게 결합된 패키지 형태의 솔루션이다. 엔비디아가 이 ‘AI 팩토리’를 먼저 할 수 있었던 이유는 소프트웨어 지원에서 한 발 앞서 있었기 때문이다. 흔히 ‘쿠다(CUDA)’의 영향력이라 하지만 꼭 그렇지만은 않다. 실제 이제 AI 생태계의 코드들은 쿠다 기반이 아니라 그 위의 프레임워크와 플랫폼 기반으로 움직이는 상태다. 물론 이 프레임워크, 플랫폼과 하드웨어를 잘 연결하는 효율도 지금까지는 엔비디아가 제일 잘했지만 듣던 만큼 완벽한 종속성을 기대할 만한 상황은 아니게 됐다.
‘블랙웰(Blackwell)’의 등장도 변화의 계기를 만들었다고 본다. 물론 블랙웰은 칩 내부 아키텍처에서는 여러 가지 변화가 있었다. 하지만 이를 단순하게 보면 의미가 달라진다. 호퍼에서 사용하던 FP8(AI 연산에서 속도와 효율성을 높이기 위해 사용되는 저정밀 포맷)을 기준으로 하면 블랙웰의 성능 향상은 트랜지스터 수와 전력 소비량이 늘어난 딱 그 정도 수준이었다. 이전 세대를 확실히 넘어서려면 ‘FP4’를 사용해야 하는데 이를 위해서는 새로운 하드웨어를 위한 소프트웨어 수정이 필요하다.
최신 ‘블랙웰’에 성능을 최적화하려면 코드를 바꿔야 한다는 상황은 예전만 못한 쿠다 종속성과 함께 새로운 상황을 만들었다. 어차피 코드를 바꿔야 하는 상황에서 경쟁사들이 프레임워크와 플랫폼 기반에서 지원을 강화하면서 꼭 엔비디아의 하드웨어만 고집할 필요가 없는 상황도 점점 다가오고 있다. 기존 ‘쿠다’ 기반 코드를 전환하는 방법 또한 얼마 전까지만 해도 ‘툴’을 고려했다면, 이제는 ‘AI’가 고려할 만한 옵션이 됐다. 그리고 이러한 옵션을 고려할 상황 자체가 줄고 있다.
실리콘 기반 칩 설계, 제조 기술의 한계가 가까워지는 시점에서 우리는 이제 좀 더 명확한 ‘선택과 집중’을 할 시기가 됐다. 이는 이미 십수 년전 인텔이 CPU에서 직면했던 문제고, 이제 엔비디아도 이 문제에 직면했다. 결국 돌파구는 ‘소프트웨어’와 ‘알고리즘’이고, 하드웨어와 소프트웨어는 서로에 최적화돼야 한다. 이 또한 이미 십여년 전부터 제시됐던 이야기지만, 막상 우리는 이를 눈 앞에 직면해서야 체감한다. 하지만 이제부터는 엔비디아만이 아니라 누구에게나 가능한 기회의 시대가 올 수 있을 것 같다.
권용만 기자
yongman.kwon@chosunbiz.com