“이전 세대 뛰어넘는 게이밍 성능” 인텔 아크 B580 리미티드 에디션 그래픽카드 ②성능편 [리뷰]

게이밍 성능, 지포스 RTX 4060과 비슷한 수준 강화된 AI 성능, 전력 소비량은 기대보다 양호해 메인스트림 그래픽카드로 ‘비용 대비 성능’ 제시

2024-12-14     권용만 기자

인텔의 ‘아크 B시리즈’ 그래픽처리장치(GPU) 제품군의 첫 제품인 ‘B580’ GPU를 탑재한 제품은 인텔이 직접 선보이는 ‘리미티드 에디션’ 이외에도 에이서, 애즈락, 스파클, 궁니르(GUNNIR), 맥스선(Maxsun), 오닉스(Onix) 등의 제조사에서 선보일 예정이다. 가격은 제품에 따라 최소 249달러(약 35만원)부터 시작하며 13일(현지시각)부터 판매가 시작된다.

인텔은 이 ‘아크 B580’이 이전 세대의 동급 제품인 ‘A580’을 넘어서는 것은 물론 이전 세대의 상위 제품인 ‘A750’을 넘어서는 성능을 보인다고 제시했다. 인텔의 테스트 결과에 따르면, 아크 B580은 이전 세대의 아크 A750보다 게임에서 평균 24% 빠르다. 이전 세대에서 아크 A750과 A770의 성능 차이가 10% 정도였던 것을 고려하면 아크 B580은 A770의 성능도 충분히 넘어설 수 있을 것이라 예상할 수 있다.

인텔은 이 ‘아크 B580’이 시장에서의 경쟁 제품인 엔비디아의 ‘지포스 RTX 4060’이나 AMD의 ‘라데온 RX 7600’보다 더 저렴하면서 더 높은 성능을 제공한다고도 제시했다. 인텔의 테스트 결과에 따르면, 아크 B580은 지포스 RTX 4060보다 전통적인 래스터 성능은 32% 높고, 레이 트레이싱 성능에서는 25% 높으면서 가격은 더 저렴하다. 인텔은 아크 B580이 주요 게임들에서 엔비디아의 지포스 RTX 4060보다는 10% 더 나은 성능을, AMD의 라데온 RX 7600보다는 14% 더 나은 성능을 제공한다고 제시했다.

인텔 아크 B580 리미티드 에디션 그래픽카드 / 권용만 기자
후면이 뚫린 디자인으로 쿨링 효율을 높인 부분이 눈에 띈다. / 권용만 기자
인텔 아크 B580/B570 그래픽카드 주요 제원 / 인텔

인텔 아크 B580 리미티드 에디션은 인텔이 직접 선보이는 제품의 ‘표준’을 제시한다. 카드 구성은 이전 세대와 비슷한 크기에 2슬롯 두께, 2팬 구성인데 이전 세대보다 팬 날개 모습에 좀 더 굴곡이 들어간 점이 눈에 띈다. 이전 세대와 달리 짧은 기판을 이용해 뒷면을 뚫어 공기가 통할 수 있게 한 쿨링 설계도 눈에 띈다. 카드 상단에는 ‘Intel ARC’ 글자에 LED 조명을 마련했으며, 외부전원 공급은 전통적인 PCIe 8핀 전원 한 개가 마련됐다.

‘아크 B580 리미티드 에디션’의 실제 기판 크기는 이전 세대보다 25% 정도 줄어든 6인치(15.24cm) 정도로 카드 크기의 절반을 조금 넘는 정도다. 기판은 8레이어 구성을 사용했고 전원 공급은 6+2페이즈 구성이다. 메모리는 19Gbps 2GB GDDR6 메모리 6개로 12GB 용량과 192비트 버스 폭을 갖췄다. 인텔은 짧은 기판과 뒷쪽이 뚫린 쿨링 설계, 새로운 팬 등으로 쿨링 성능 뿐만 아니라 소음도 크게 줄였다. 

경쟁 제품들이 128비트 버스 폭의 8GB 메모리만 제공하는 데 비해, 192비트 버스 폭의 12GB 메모리를 갖춘 것도 아크 B580의 경쟁력을 높이는 부분이다. 이는 1080p급 게이밍 뿐만 아니라 1440p급 게이밍과 레이 트레이싱을 활용할 때 의미 있는 성능 차이를 만들 수 있을 부분이다. 또한 PC에서 거대언어모델(LLM)이나 이미지 생성 등의 AI 모델을 사용할 때도 더 많은 메모리는 좀 더 큰 규모의 모델을 사용할 수 있는 여유를 제공한다.

한편, 인텔 아크 B580은 비교적 최신 PC와 함께 사용하는 것이 추천된다. 그래픽카드가 사용하는 인터페이스는 PCIe 4.0 x8로 11세대 코어 프로세서 이후의 PCIe 4.0을 지원하는 플랫폼에서는 문제가 없지만, PCIe 3.0을 사용할 때는 다소 전송 성능이 아쉬워질 수 있다. 인텔 플랫폼에서는 리사이저블 BAR(Resizable BAR), AMD 플랫폼에서는 스마트 액세스 메모리(Smart Access Memory)가 활성화돼 있어야 제 성능을 발휘할 수 있다.

인텔의 공식 지원 플랫폼은 인텔의 10세대 코어 프로세서 이후 혹은 AMD 라이젠 프로세서와 AMD 500 시리즈 칩셋 기반 메인보드 혹은 이후 세대다. 또한 그래픽 부하가 낮은 상태에서 소비전력 최적화를 위해서는 PCIe 전력 관리 기능이 운영체제 수준에서 제어할 수 있도록 활성화돼 있어야 한다. 이런 부분들이 다소 까다롭게 느껴질 수 있겠지만 최신 플랫폼에서는 그리 큰 문제가 될 부분은 아니다. 

3DMark 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(DirectX Ray Tracing Feature Test) 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자

테스트 시스템은 인텔 코어 울트라 9 285K 프로세서와 에이수스의 ROG 스트릭스 Z890-E 게이밍 와이파이 메인보드, 64GB DDR5-5600 메모리를 사용했다. 운영체제는 마이크로소프트 윈도 11 24H2의 11월 정규 업데이트까지 적용했다. 

비교 대상으로 사용한 그래픽카드는 인텔 아크 A770 리미티드 에디션 16GB, 엔비디아 지포스 RTX 4060 8GB 그래픽카드를 사용했다. 그래픽 드라이버는 아크 B580에 101.6251, A770에는 101.6299를, 지포스 RTX 4060에는 566.36 버전을 사용했다.

그래픽카드의 게이밍 그래픽 성능을 확인할 수 있는 ‘3D마크(3DMark)’의 전반적인 성능은 이전 세대의 최상위 모델인 아크 A770을 훌쩍 넘어선다. 항목별로 보면 ‘타임 스파이’ 시리즈에서는 B580이 A770을 11%, ‘포트 로열’에서는 13% 정도로 앞선다. ‘스피드 웨이’에서는 성능 차이가 3% 정도로 줄고, ‘스틸 노마드’에서도 성능 차이는 7% 정도로 나타난다. 하지만 이 B580의 구성이 A770보다 낮은 급임을 생각하면 충분히 높은 성능 향상을 달성했다고 볼 수 있겠다.

엔비디아의 지포스 RTX 4060과 비교하면 ‘타임 스파이’와 ‘포트 로열’, ‘스틸 노마드’ 모두 30~40% 정도의 차이를 보이는 것도 특징이다. 사실 3D마크 테스트의 경우 이전 세대의 A770도 경쟁 제품과 비교해 한 체급 높은 성능을 보였던 바 있다. 하지만 ‘스피드 웨이’의 경우는 지포스 RTX 4060쪽이 8% 정도 높은 성능을 보이는 모습이다.

‘레이 트레이싱’ 성능에서 B580은 A770보다는 10% 정도 떨어지고, 지포스 RTX 4060보다는 10%정도 좋은 성능을 보인다. B580의 Xe2코어에서 레이 트레이싱의 유닛 성능이 대폭 높아지긴 했지만 결과에서는 유닛 개수가 60% 많은 A770을 완전히 넘어서지는 못한 모습이다. 

3DMark(Mesh Shader Feature Test) 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자
3DMark(Sampler Feedback Feature Test) 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자
3DMark(XeSS Feature Test: XeSS 1.3.1) 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자

메시 쉐이더(Mesh Shader) 기능 테스트에서 아크 B580은 기능을 끈 상태에서는 A770 대비 15% 높은 성능을 냈지만, 메시 쉐이더를 켠 상태에서는 비슷한 성능을 냈다. 이는 아크 B 시리즈의 내부 구조에서 전통적인 ‘래스터’ 처리 성능과 효율을 높인 데서 나오는 특징으로 이해할 수 있겠다. 지포스 RTX 4060과 비교하면 메시 쉐이더를 끈 상태에서는 RTX 4060쪽이 두 배 이상 높은 성능을 보이지만 켠 상태에서는 B580쪽이 29% 더 높은 성능을 보이는 점도 인상적이다.

샘플러 피드백 기능 테스트에서는 B580이 A770 대비 기능을 끈 상태에서는 22%, 켠 상태에서는 6% 정도 성능 우위를 보였다. 지포스 RTX 4060과 비교하면 기능을 끈 상태에서는 거의 같은 성능을 보였지만 켠 상태에서는 17% 더 높은 성능을 보였다. 다이렉트X(DirectX) 12의 주요 기능 테스트 전반에서 아크 B580은 이전 세대 대비 성능 향상과 함께 이전 세대에서부터 이어져 오던 최신 API 환경에서의 높은 경쟁력을 이어 나가는 모습이다.

아크 B580은 XeSS 성능에서도 이전 세대의 최상위 모델을 쉽게 넘어서는 모습이다. XeSS 1.3.1의 슈퍼샘플링 성능 테스트에서 XeSS를 사용하지 않은 상태에서는 12% 높은 성능을, XeSS 1.3.1의 슈퍼샘플링 기술을 사용한 상태에서는 5~8% 정도 높은 성능을 제공한다. 지포스 RTX 4060과 비교하면 XeSS를 사용하지 않은 상태에서는 26% 정도 B580이 높은 성능을 보이고, XeSS를 사용하는 경우는 B580이 20~30%정도 성능이 높다.

Shadow of the Tomb Raider 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자
Borderlands 3 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자
Forza Motorsport 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자

쉐도우 오브 더 툼레이더(Shadow of the Tomb Raider) 게임에서 아크 B580은 이전 세대인 아크 A770보다 1080p 기준 38% 높은 성능을 보였다. B580의 Xe 코어 수가 40% 적은 것을 고려하면 인텔이 제시한 Xe 코어당 성능 향상 폭을 훌쩍 넘어서기까지 하는 결과다. 지포스 RTX 4060과 비교하면 네이티브 렌더링에서는 B580이 4% 성능이 높고 레이 트레이싱을 사용하면 B580이 7% 높은 성능을 보인다. 하지만 지포스 RTX 4060의 DLSS 기술은 B580의 XeSS보다 여전히 한 단계 높은 성능을 보인다. 

다이렉트X 12를 사용하는 ‘보더랜드 3(Borderlands 3)’에서 아크 B580은 A770보다 14% 높은 성능을 제공한다. 지포스 RTX 4060과 비교하면 13% 정도 높은 성능이다. 150% 스케일링 옵션을 사용한 경우 B580과 A770간 성능 차는 동일한 반면 B580과 RTX 4060간의 성능 차이는 21%까지 벌어진다. 이는 지포스 RTX 4060이 상대적으로 작은 8GB 메모리와 128비트 메모리 버스 폭을 가진 부분이 고해상도에서 영향을 준 것으로 보인다.

‘포르자 모터스포츠(Forza Motorsport)’의 1080p 아주 높음 옵션에서 아크 B580은 A770보다 18% 높은 성능을 보였지만 지포스 RTX 4060보다는 6% 정도 낮은 성능을 보였다. 하지만 1080p에 레이 트레이싱 기술을 적용한 경우에는 B580이 A770은 물론이고 지포스 RTX 4060보다도 23% 높은 성능을 보였다. 지포스 RTX 4060의 성능 하락 폭이 컸던 이유는 메모리 용량 때문이다. 이 옵션에서 비디오 메모리 요구사항은 8.5GB 정도로, 지포스 RTX 4060의 8GB 메모리 구성은 메모리 부족으로 인한 성능 하락에 직면한다.

UL Procyon(Photo/Video Editing) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Computer Vision) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Image Generation) 테스트 결과, 높을수록 좋다. / 권용만 기자
인텔 아크 B580 리미티드 에디션 그래픽카드 전력소비량, 단위 '와트(W)', 낮을수록 좋다. / 권용만 기자

GPU 가속을 활용하는 콘텐츠 제작 환경에서 아크 B580은 나름 실용적인 성능을 보인다. 어도비 크리에이티브 클라우드 앱의 성능을 측정하는 UL 프로시온(Procyon)의 사진 편집 테스트에서 아크 B580은 아크 A770을 아주 약간 앞서지만, 지포스 RTX 4060보다는 조금 뒤지는 성능을 보였다. 하지만 세 그래픽카드 모두 절대 성능 자체는 충분하다. GPU 가속 비디오 편집에서는 A770 쪽이 좀 더 높은 성능을 보였고 B580과 RTX 4060이 비슷한 성능을 보였다. 이는 A770의 메모리 구성 측면이 이점으로 작용한 것으로 보인다.

AI 성능에서는 이전 세대 대비 기대 이상 높은 성능 향상을 보인다. UL 프로시온의 AI 컴퓨터 비전 벤치마크에서 아크 B580은 아크 A770 대비 오픈비노(OpenVINO)에서 1.7배, 윈도ML의 FP16 형식에서는 2.5배의 성능을 보였다. 이는 소프트웨어 업데이트보다 하드웨어가 좀 더 효율적인 AI 실행에 최적화된 부분이 커 보인다. 

지포스 RTX 4060과 비교해도 윈도ML과 최적화된 라이브러리 사용시 모두 B580쪽이 우위를 보여주고 있다. 특히 오픈비노와 텐서RT 사용시의 정수연산 성능에서 B580이 23% 높은 성능을 보이는 부분이 눈에 띈다.

스테이블 디퓨전(Stable Diffusion) 1.5의 INT8, FP16 형식 이미지 생성에서도 아크 B580은 A770 대비 크게 높은 성능을 보인다. B580의 스테이블 디퓨전 이미지 생성 성능은 FP16 형식에서도 A770보다 45% 높고 경량화된 INT8 형식을 사용하면 성능 차이는 82%에 이른다. 향후 PC에서 양자화된 모델들이 더 많이 활용될 것을 감안하면, 아크 B 시리즈의 성능은 그 의미가 좀 더 커질 것이다. 한편 지포스 RTX 4060과 비교하면 INT8 형식에서 아직 성능 차이가 꽤 있는데 향후 소프트웨어 최적화로 차이를 좁힐 수 있을 것으로도 기대된다.

아크 B580에서 또 다른 인상적인 부분은 ‘전력 소비량’이다. 1080p 모니터 한 대 정도를 사용하는 경우 사용량이 높지 않은 경우 그래픽카드의 소비전력량은 6~8W 정도로 측정됐다. 이는 이전 세대 A770이 같은 조건에서 20~22W 정도를 보였던 것에 비해 절반 이하로 줄어든 것이다. 8K AV1 영상 재생시에는 28W 정도를 소비했고, 그래픽카드에 높은 부하가 가해지는 3D마크 타임 스파이 테스트에서도 소비전력은 140W 정도에 그쳤다. 인텔의 발표보다는 제법 낮은 수준이고 경쟁 제품들과도 비슷한 수준이다.

이전 세대의 약점 극복하고 한층 더 발전한 ‘인텔 아크 B580 리미티드 에디션’ 그래픽카드 / 권용만 기자

새로운 2세대 ‘아크 B 시리즈’는 이전 세대에서 제시했던 강점은 유지하면서 약점은 크게 개선한 부분이 눈에 띈다. 메인스트림 급 5 시리즈로 등장한 B580이 이전 세대 최상위 모델의 성능을 넘고 시장의 경쟁 제품들과 충분히 견줄 만한 위치에 섰으며 게임들과의 성능, 호환성 문제도 많이 줄였다. AI 성능에서도 매력적이며 인텔 또한 적극적인 지원에 나서고 있다. 이전 세대에서 아쉬움이 남던 부분들이 해결된 점은 긍정적으로 평가할 수 있을 부분이다.

무엇보다 아크 B580에서 주목할 만한 부분은 ‘가격 경쟁력’이다. 인텔은 ‘아크 B580’을 경쟁 제품 대비 좀 더 높은 성능을 제시하면서도 권장 가격은 경쟁 제품 대비 낮은 249달러로 설정했다. 전 세대가 처음 등장하던 2년 전과 비교하면 성능과 지원 모두 더 좋은 모습이고 좀 더 다양한 제품들이 선보일 것으로도 기대된다. 아크 B580이 점점 양극화돼 가는 PC 시장과 게이밍용 그래픽카드 시장에서 변화의 계기를 만들 만한 잠재력을 갖춘 것은 분명해 보인다.

물론 이전 세대들부터 이어져 온 ‘선입견’을 한 번에 넘어서는 것은 쉽지만은 않을 것이다. 여전히 고성능 GPU를 사용하는 게임과 소프트웨어 환경이 현실적으로 엔비디아 중심의 기울어진 운동장 같은 환경이라는 점도 극복해야 할 부분이다. 하지만 이러한 어려움에도 인텔 아크 B 시리즈의 첫 출발은 이전 세대보다는 매우 긍정적이며 앞으로 더 기대할 수 있을 여지도 충분하다. 이제는 아크 그래픽카드를 선택하는 것이 ‘모험’을 넘어 ‘대안’이 될 시기가 됐다.

권용만 기자

yongman.kwon@chosunbiz.com