슈퍼마이크로 “엔비디아 블랙웰 공급 연기, 당분간 대안은 ‘H200’”

2024-08-09     권용만 기자

엔비디아의 차세대 데이터센터용 GPU ‘블랙웰(Blackwell)’이 설계 결함으로 출하가 연기될 수 있다는 것이 파트너들을 통해 간접적으로 확인됐다. 업계에서는 ‘블랙웰’이 예정보다 몇 개월 가량 연기되는 동안, 기존의 H200 GPU 등이 현실적인 대안이 될 것으로 전망했다.

엔비디아 블랙웰 GPU / 엔비디아

찰스 리앙(Charles Liang) 슈퍼마이크로컴퓨터 CEO는 6일(현지시각) 열린 슈퍼마이크로컴퓨터의 2024회계연도 4분기 실적발표 컨퍼런스 콜에서 “엔비디아 쪽에서 약간의 지연이 있는 것으로 들었다. 이 정도는 충분히 있을 수 있는 일이라 생각한다”고 언급한 것으로 알려졌다. 이 언급에서의 ‘지연’은 최근 언급된 블랙웰 GPU의 공급 지연에 관련된 것으로 해석된다. 

또한 “하지만 우리는 수랭 구성을 사용하는 H200 등 새로운 솔루션을 공급하는 데는 문제가 없다. 기술 기업의 입장에서 좀 더 나은 공급 일정을 바라긴 한데, 이번 지연으로 인한 문제는 없진 않겠지만 그리 크지도 않을 것이다” 라고 덧붙였다.

최근 엔비디아의 차세대 GPU ‘블랙웰’은 설계 문제로 공급이 지연될 수 있다고 알려진 바 있다. 세미애널리시스(SemiAnalysis)는 이번 문제에 대해, 블랙웰 GPU을 구성하는 각 타일의 설계에 있어, GPU 칩렛과 LSI 브릿지, 인터포저 등 각 타일이 조합된 상황에서의 열팽창 관련 설계가 잘못된 것으로 보인다고 지적한 바 있다. 그리고 이를 해결하기 위해서는 일부 회로의 재설계가 필요하고, 몇 개월 정도가 필요할 것으로 전망했다. 

또한 세미애널리시스는 엔비디아는 현재 HGX 서버를 위한 1000W 열설계전력의 B200을 소량 생산할 계획을 가지고 있는데, TSMC의 CoWoS-L 패키징 생산량과 설계 문제 등이 영향을 주고 있다고 언급했다. 1200W B200 GPU가 사용되는 하이엔드 GB200 기반 NVL36, NVL72 서버도 4분기 중 소량 생산돼 일부 고객에 인도될 것으로 전해졌다.

한편, 엔비디아는 지난 3월 엔비디아의 연례 행사 ‘GTC 2024’를 통해 차세대 GPU 아키텍처인 ‘블랙웰’을 공개한 바 있다. 당시 엔비디아는 ‘블랙웰’ 기반 B200 텐서 코어 GPU가 기존 ‘호퍼’ 대비 트랜지스터 집적 수는 두 배 이상 증가했고, FP4 기반 AI 성능은 호퍼의 FP8 기반 성능 대비 5배 향상됐다고 발표한 바 있다. 

권용만 기자 yongman.kwon@chosunbiz.com