오늘날 ‘인공지능(AI) 시대’에 ‘그래픽처리장치(GPU)’에 대한 관심은 그 어떤 주제보다 뜨겁다. 특히 거대언어모델(LLM)을 위한 데이터센터용 GPU는 여전히 돈이 있어도 구입하기 어려울 정도로 높은 수요를 보이고 있다. 가상화폐 채굴 붐으로 일반 소비자용 그래픽카드들이 시장에서 자취를 감췄던 적도 있다. 여러 모로 그래픽처리장치는 그래픽을 넘어 시대의 요구를 위한 또 다른 ‘혁신 엔진’이 됐다.
현재 ‘GPU’ 업계 중 연산과 그래픽 모두에서 가장 큰 영향력을 가진 업체로는 ‘엔비디아’가 꼽힌다. PC의 게이밍용 고성능 그래픽카드 시장은 엔비디아와 AMD의 양강 구도라지만 크게 기울어져 있고, 데이터센터용 GPU 시장은 엔비디아의 독주 시대라고 해도 크게 틀린 말은 아니다. 최근 몇 년간의 엔비디아만 보면 마치 이런 시대가 앞으로도 깨지지 않을 것 같은 기분이 들 정도다.
엔비디아의 일반 소비자용 GPU 브랜드는 ‘지포스(GeForce)’다. 이 ‘지포스’ 브랜드는 1999년 10월 GPU 개념을 처음 주창한 ‘지포스 256(GeForce 256)’으로 선보여 25년째 이어지며 그래픽을 넘어 연산 처리까지 역할이 확장되어 왔다. 오늘날 데이터센터용과 일반 소비자용 ‘지포스’ GPU는 기본 설계 개념을 공유하는 관계다. 지금까지 25년에 걸친 ‘지포스’의 역사는 마냥 평탄하지만은 않았았다. 하지만 현재 크게 주목받는 ‘쿠다(CUDA)’의 도입이나 AI를 위한 준비 등은 컴퓨팅 시장 전반의 변화에 큰 영향을 줬다.
‘지포스’의 등장, ‘3D 가속기’의 ‘GPU’로의 진화
1999년 10월 등장한 ‘지포스 256’은 여러 가지의 ‘최초’가 담긴 제품이다. 일단 ‘지포스’ 브랜드의 시작인 이 제품은 당시 ‘다이렉트X 7.0’과 하드웨어 T&L(Transform&Lightning)을 지원하는 첫 제품이었다. 특히 ‘하드웨어 T&L’은 이전까지 3D 그래픽 처리에서 변환과 광원 처리를 CPU가 하고 그래픽카드가 텍스처 관련 처리를 주로 하던 것과 달리 변환과 광원 처리까지 그래픽카드가 하는 것으로 역할이 확장됐고 ‘GPU’ 개념이 등장했다.
이 ‘지포스 256’은 등장 당시부터 큰 화제를 모았다. 시장에서 최초의 ‘다이렉트X 7.0’을 지원하는 카드였으며 상황에 따라서는 기존의 ‘리바 TNT2 시리즈’를 제법 큰 성능 차이로 앞섰다. 특히 당시 ‘퀘이크 3(Quake 3)’에서 지포스 256이 선보인 성능은 가히 압도적이었다. 3dfx ‘부두’와의 경쟁도 ‘지포스 256’이 등장하면서 실질적으로 끝났다고 봐도 될 정도였다.
본격적인 ‘지포스’ 시대는 ‘지포스 2’ 시리즈와 함께 시작됐다. 사실 이 ‘지포스 2’는 기존 ‘지포스 256’의 개선으로, 새로운 공정으로 동작 속도를 크게 높이고 텍스처 유닛을 확장해 ‘기가 텍셀 쉐이더(Giga Texel Shader)’ 시대를 처음 연 카드였다. 보급형 모델로 등장한 ‘지포스 2 MX’ 시리즈의 파급력도 굉장했다. 이 ‘MX’ 시리즈는 엔비디아의 기존 보급형 모델을 대체한 것은 물론이고 경쟁사의 메인스트림 모델과 비교해도 경쟁력이 높았다.
‘지포스’의 등장은 경쟁사들이 대거 사라진 계기가 되기도 했다. 특히 PC 게이밍에서 경쟁사였던 ‘3dfx’의 경쟁도 이 시기에 완전히 넘어갔다. 3dfx의 부두는 자체적인 ‘글라이드(Glide)’ API에서 강점이 있지만 ‘다이렉트X’ 환경에서는 이미 ‘리바 TNT2’ 시절부터 AGP(Accelerated Graphics Port) 지원 문제 등에서 경쟁력이 떨어지는 상태였다. 이후 3dfx가 선보인 ‘부두 4’는 지포스 256에도 경쟁하기 힘든 상황이었고 결국은 엔비디아에 인수됐다.
사실 이 시기의 경쟁자 중 살아남은 것은 AMD에 인수된 ATi 정도다. AMD는 이 ‘지포스 256’의 대항마로 하드웨어 T&L 엔진을 탑재한 초대 ‘라데온(Radeon)’을 2000년 4월 발표했다. 하지만 타 경쟁사들은 이 ‘하드웨어 T&L’ 엔진을 탑재한 제품을 제 때 내지 못했다. S3의 ‘새비지 2000(Savage 2000)’은 하드웨어 T&L 엔진이 있었어도 제대로 쓰지 못했다. 매트록스는 2002년 ‘다이렉트X 8.1’ 기반 ‘파헬리아(Parhelia)’를 내놓았지만 너무 늦었다.
쉐이더 전성시대, 가변형 구조에서 쓴 맛 본 ‘지포스 FX’
‘다이렉트X 7.0’이 ‘하드웨어 T&L’로 시대를 바꿨다면 이후 ‘다이렉트X 8.0’은 ‘쉐이더(Shader)’가 시장 판도를 바꿨다. ‘다이렉트X 9.0’에서는 쉐이더 활용 유연성이 높아진 ‘쉐이더 모델 2.0’ 등이 선보였다. ‘다이렉트X 9.0’을 지원한 하드웨어 중 가장 먼저 등장한 하드웨어는 2002년 8월 등장한 AMD의 ‘라데온 9700’이였다. 이 제품군은 많은 사용자들에 역대 AMD의 GPU 중에서도 가장 인상적인 제품군 중 하나로 손꼽힌다.
이 시기에 엔비디아가 선보인 대항마는 2003년 1월 선보인 ‘지포스 FX’ 시리즈다. 엔비디아는 ‘지포스 4’에 이어 ‘5 시리즈’가 아니라 ‘FX’ 시리즈라고 이름붙인 이 시리즈에서 ‘시네FX 2(CineFX 2)’ 엔진을 탑재하며 ‘영화급 표현력’을 갖춘 그래픽을 강조했다. 지포스 FX 시리즈의 기능은 ‘다이렉트X 9.0’ 표준을 좀 더 넘어설 정도였던 만큼 이론적으로는 기대가 높았던 제품이다.
하지만 현실에서 ‘지포스 FX’ 시리즈는 지포스 역사상 ‘최악’을 꼽으면 꼭 상위에 언급되는 제품이 됐다. 과거와의 호환성과 현재의 표준, 이를 넘어서는 가능성을 모두 담으면서 설계가 지나치게 복잡해졌다. 다양한 기능을 수행하는 데 집중한 ‘가변형 유닛’들의 성능 효율 문제 등까지 겹쳤던 점도 있다. 실제 게임에서 이 칩의 최대 성능을 내는 데는 상당한 제약이 있었다.
결국 엔비디아는 다음 세대인 ‘지포스 6’ 시리즈에서 어느 정도는 전통적인 ‘고정 유닛’ 기반 설계로 돌아가면서 구조를 확장해 성능을 대폭 끌어올리는 선택을 했고 다시금 시장에서의 주도권을 가져오게 됐다. 한편, 이 시절 지포스 FX를 괴롭히던 상대 중 하나는 라데온의 ‘변종’ 모델이었는데 특히 상위 9600 시리즈의 존재감을 지워 버린 ‘9550 시리즈’ 변종들은 시장에서 엔비디아와 AMD 모두에 화제와 고민을 동시에 안긴 모델이기도 했다.
‘GPU 연산’ 시대 시작한 ‘지포스 8’ 시리즈
2006년 11월 처음 선보인 ‘지포스 8 시리즈’도 시장에 큰 충격을 안긴 제품으로 꼽힌다. ‘윈도 비스타(Windows Vista)’부터 쓸 수 있던 ‘다이렉트X 10’을 처음 지원하면서 아키텍처도 기존의 ‘고정 유닛’ 기반에서 ‘통합 쉐이더’ 형태로 바뀌었다.
이 ‘통합 쉐이더’ 시대로의 변화는 GPU가 실제 그래픽 연산 이외에도 다른 ‘범용 연산’을 할 수 있는 여지를 남겼는데 이를 현실화한 것이 ‘쿠다(CUDA)’다. 엔비디아 또한 이 ‘쿠다’의 등장을 엔비디아의 역사에서 중요한 변곡점 중 하나로 꼽는다. 오늘날 엔비디아와 쿠다의 위상을 생각하면 충분히 납득할 만 하다. 하지만 쿠다가 처음 선보이던 2006년 당시에는 GPU연산의 필요성에 대한 회의론도 나왔고 쿠다가 경쟁력이 되지는 않던 시절이었다.
지포스 8 시리즈 제품들은 ‘윈도 비스타’의 흥행 실패와 함께 ‘다이렉트X 10’의 장점을 보여줄 기회를 제대로 가질 수는 없었지만 출시와 함께 시장의 주도권을 잡는 데는 문제가 없었다. 고성능 제품군인 ‘지포스 8800’ 시리즈는 기존 ‘다이렉트X 9.0c’ 기반 환경에서도 이전 세대를 확실히 압도하는 그래픽, 게이밍 성능을 제공할 수 있었기 때문이다.
당시 메인스트림 모델인 ‘지포스 8600 시리즈’에서 선보인 ‘퓨어비디오 HD(Purevideo HD)’는 당시 듀얼 코어 프로세서로도 어렵던 ‘1080p H.264’ 영상 재생을 프로세서 점유율 5% 정도로도 끊김 없이 해 내는 ‘하드웨어 디코딩’ 기술을 제공해 화제를 만들기도 했다. 이제 이 하드웨어 디코딩 기술은 PC부터 모바일까지 모든 GPU에 ‘기본 기능’이 됐다.
이 ‘지포스 8 시리즈’는 일부 모델에서는 몇 번의 리네이밍으로 긴 수명을 보여주기까지 했다. 대표적으로 8800GT 모델은 9800GT와 같고, G92 칩 기반의 8800GTS는 9800GTX를 거쳐 GTS250까지 이름이 바뀌었다.
이후 ‘GPU 연산’의 시대는 ‘지포스 400 시리즈’에서 또 한번 변화의 계기를 맞았다. 2010년 선보인 ‘지포스 400 시리즈’는 새로운 쿠다 규격과 함께 연산 관련 기능과 성능을 대폭 강화하며 등장했다. 당시 TSMC의 공정 문제와 함께 성능과 발열 측면에서 제법 아쉬운 결과를 받아들여야 했다. 이 문제 또한 두 세대 뒤의 ‘지포스 600 시리즈’에서 설계 균형을 조절하면서 해결됐다.
게이밍에서의 ‘AI 시대’ 개척자, ‘지포스 RTX 시리즈’
AI 시대의 초창기 업계 최대의 과제는 이미지 인식이었다. 이를 GPU로 처리해 성과를 크게 높인 데서부터 GPU 연산의 가능성이 주목받아 왔다. 엔비디아는 게이밍의 미래로 ‘AI’를 지목하고 이를 실제 그래픽카드 수준에 적용하는 것을 시도했다. 이러한 시도의 첫 결과가 ‘지포스 RTX 20’ 시리즈이다. 이전 세대인 ‘지포스 10 시리즈’와 비교하면 레이 트레이싱을 위한 ‘RT 코어’와 행렬 연산에 특화된 ‘텐서 코어’가 탑재된 것이 차별점이다.
지포스 RTX 시리즈에서 주목할 만한 특징은 지금까지 전문 그래픽 렌더링에서나 쓰던 ‘레이 트레이싱’을 실시간 하드웨어 가속한다는 점과 AI 기반 업샘플링 기술인 ‘DLSS(Deep Learning Super Sampling)’ 기술이었다. 특히 ‘DLSS’ 기술은 게이밍 성능을 높이기 위해 낮은 해상도에서 렌더링한 장면을 AI 알고리즘과 텐서 코어를 사용해 업샘플링해 높은 해상도로 보여주는 기술로 AI 기술을 활용해 그래픽 성능과 사용자 경험을 높이는 좋은 예가 됐다.
지포스 RTX 시리즈가 처음 나왔을 때는 이 ‘텐서 코어’가 다소 평가 절하됐지만 생성형 AI의 등장과 함께 이 평가 또한 제법 바뀌었다. 트랜스포머 모델을 사용하는 현재의 주요 생성형 AI 모델에서 이를 가속하는 텐서 코어의 존재는 GPU의 존재 의의와도 직결되는 부분이 됐다. 사실 최근의 모델에서 GPU 가속 성능은 대부분 텐서 코어의 몫이기도 하다.
지포스 RTX 20 시리즈는 2018년 9월 처음 등장했는데, 처음 등장했을 때는 기존 ‘지포스 10 시리즈’와 비교해 상대적으로 높은 가격으로 인기가 떨어지는 편이었다. 지포스 RTX 20 시리즈에서 텐서 코어와 RT 코어가 제거된 ‘지포스 16 시리즈’도 등장할 정도였다. 이후 성능이 대폭 향상된 ‘지포스 RTX 30 시리즈’는 출시 초반부터 코로나 19 팬데믹에 이은 전 세계적인 공급망 대란 사태를 맞기도 했고, 가상화폐 채굴 대란에도 휩쓸렸다.
현재 ‘지포스 RTX 40 시리즈’는 출시된 지 약 2년이 지났다. 차세대 제품이 곧 출시될 것으로 기대된다. 이미 차세대 아키텍처로는 ‘블랙웰(Blackwell)’이 소개됐다. 하지만 관련 제품은 데이터센터의 AI 연산을 위한 가속기 관련 제품만 발표된 상태다. 많은 사람들이 차세대 게이밍 그래픽카드가 ‘블랙웰’을 기반으로 할 것으로 추측하지만 확신할 수는 없다. 혹자는 “엔비디아는 게이머를 버렸다”지만 엔비디아는 공식적으로 “게이머를 버리지 않았다”는 입장이다. 이제 또 한번의 시대적 변화가 펼쳐질 시기가 얼마 남지 않았다.
권용만 기자 yongman.kwon@chosunbiz.com
- 폭스콘 “엔비디아 ‘GB200’ 위한 세계 최대 생산시설 멕시코에 건설 중”
- 엔비디아, 미국 정부 추진 ‘글로벌 AI 포용성 이니셔티브’ 동참
- 에이수스, AI 노트북 ‘프로아트 P16ㆍPX13’ 출시…지포스 RTX 40 시리즈 장착
- 엔비디아, 오픈USD 활용 확대 ‘생성형 AI 모델과 마이크로서비스’ 발표
- 엔비디아, 라마 3.1 활용한 ‘AI 파운드리’ 서비스 발표…맞춤형 슈퍼모델 구축 지원
- 엔비디아, “RTX 그래픽카드 품은 AI PC 1억대 보급…다양한 AI 기술 제공”
- 복잡한 조립 PC 가성비 구성 ‘정답’ 잡았다, 샵다나와 ‘가성비 PC’ [리뷰]
- AI 위한 고성능 PC 구성의 정석, 샵다나와 추천 AI PC [리뷰]
- 젠슨 황 엔비디아 CEO “국가 기본 인프라와 같이 소버린 AI 갖춰야”
- AI노트북 시장 점유율 50% 돌파 외 [PC마켓]
- 비즈니스vs 일반 노트북, 하드웨어 같아도 3년 지나 가치 다른 이유 [권용만의 긱랩]
- 만능 포트 ‘썬더볼트’, 색다른 가능성 [권용만의 긱랩]
- 엔비디아 “3분기 매출 전년비 94% 성장, 데이터센터는 전년비 112% 늘어”
- 인텔, 차세대 게이밍용 GPU “엔비디아 RTX 4060보다 저렴하고 성능 높아”
- “이전 세대 뛰어넘는 게이밍 성능” 인텔 아크 B580 리미티드 에디션 그래픽카드 ②성능편 [리뷰]
- 배터리 오래 가는 노트북 고르는 방법은 [권용만의 긱랩]