고성능 프로세서의 성능 경쟁 추이는 시대에 따라 달라져 왔다. 특히 멀티 코어 프로세서의 시대가 본격적으로 열리면서 프로세서의 성능을 평가하는 기준은 더욱 복잡해졌다. 오늘날 프로세서의 성능은 더 이상 단순히 ‘동작 속도’나 ‘코어 수’로 단순히 파악할 수 없고, 수많은 프로그램과 사용 시나리오에서 자신에 맞는 특성을 갖춘 프로세서를 찾아야 하는 ‘워크로드 최적화’의 시대가 왔다.

현재 PC에서의 ‘워크로드 최적화’에 있어 양대 프로세서 제조사인 인텔과 AMD의 접근법은 사뭇 다르다. 인텔은 12세대 코어 프로세서에서부터 단일 다이에서 면적 대비 성능 효율을 극대화하기 위한 ‘퍼포먼스 하이브리드’ 구성을 선보였다. AMD는 ‘라이젠’ 프로세서와 함께 더 많은 코어 수 구현을 위한 칩렛 구조를 도입하고, 더 큰 캐시로 메모리 지연을 줄여 게이밍 등에서의 성능을 높이는 ‘3D V-캐시’ 구조 등을 선보인 바 있다.

AMD의 ‘라이젠 9 7950X3D’ 프로세서는 최신 ‘젠4’ 아키텍처 기반에 이전 세대에서도 좋은 반응을 얻었던 ‘3D V-캐시’를 적용한 프로세서다. 개당 8개 코어를 갖춘 CCD(CPU Compute Die) 두 개로 16코어 구성을 갖춘 ‘라이젠 9 7950X’ 프로세서에서 하나의 CCD에 64MB L3 캐시를 3D 적층 패키징한 ‘3D V-캐시’를 갖춘 ‘하이브리드’ 구성으로, 게이밍과 멀티코어 작업 성능 모두에서 뛰어난 성능과 효율을 기대할 수 있는 것이 특징이다.

AMD 라이젠 9 7950X3D 프로세서 / 권용만 기자
AMD 라이젠 9 7950X3D 프로세서 / 권용만 기자
‘3D V-캐시’ 적용, 젠4 아키텍처의 ‘진화’

AMD ‘라이젠 7000’ 시리즈는 AMD에 있어 모든 것의 ‘세대 전환’을 의미하기도 한다. 프로세서의 코어 마이크로아키텍처는 ‘젠(Zen) 4’로 세대교체됐으며, 플랫폼 또한 DDR5 메모리, PCIe 5.0을 지원하는 ‘AM5’ 소켓 기반 플랫폼으로 바뀌었다. 특유의 칩렛 구조는 그대로인데, 다이당 8개 코어를 탑재한 CPU 컴퓨트 다이는 TSMC의 5나노미터(nm) 공정을, 입출력(I/O) 관련 기능들이 담긴 I/O 다이는 TSMC의 6나노미터(nm) 공정을 사용한다.

AMD의 ‘젠’ 시리즈 마이크로아키텍처는 초창기부터 코어 확장에 유리한 구조가 특징으로 꼽힌다. 특히 여러 개의 CPU 컴퓨트 다이를 하나의 패키징에 탑재하는 칩렛 구조는 일부 상황에서 몇몇 단점이 부각되지만, 비용 효율적으로 코어 수를 늘릴 수 있는 방법이다. 칩렛 방식에서 발생할 수 있는 몇몇 단점은 ‘젠 3’ 이후 다이당 8코어 컴플렉스 구조를 탑재하면서 상당 부분 극복했으며, 게이밍 등에서는 단일 다이 구성과 같은 효과를 얻었다.

‘젠 4’아키텍처는 이전 세대 대비 향상된 분기예측이나 더 커진 캐시 등으로, 이전 ‘젠 3’ 대비 같은 동작속도에서 평균 13% 가량 향상된 성능을 제공한다. 또한 ‘젠 4’에서는 AVX-512 지원이 추가되어 이를 지원하는 애플리케이션에서는 상당한 수준의 성능 향상을 제공한다. 현재 인텔이 메인스트림 PC용 코어 프로세서에서 AVX-512를 지원하지 않는 것과 비교하면 장점으로 볼 수 있을 부분이다. 하지만, 지금까지 AVX-512의 활용도가 극히 낮았던 것을 생각하면 소프트웨어 지원 부분이 앞으로 과제가 될 것으로 보인다.

데스크톱 PC를 위한 라이젠 7000 시리즈는 현재 6코어 12스레드의 라이젠 5 7600부터 16코어 32스레드의 라이젠 9 7950X3D까지의 제품군이 준비되어 있다. 라이젠 7000 시리즈는 기본적으로 CPU 컴퓨트 다이(CCD)와 I/O 다이(IOD)가 분리된 칩렛 구조를 사용한다. 8코어 16스레드 구성의 라이젠 7까지는 CPU 컴퓨트 다이 한 개를, 최대 16코어 32스레드 구성의 라이젠 9에서는 CPU 다이 두 개를 사용하는 것이 특징이다.

두 개 CCD 중 한 개에만 ‘3D V-캐시’가 적용된 라이젠 9 7900X3D 시리즈 / AMD
두 개 CCD 중 한 개에만 ‘3D V-캐시’가 적용된 라이젠 9 7900X3D 시리즈 / AMD
라이젠 9 7950X3D는 라이젠 9 7950X 모델을 기반으로 두 개의 CPU 컴퓨트 다이 중 하나에 ‘3D V-캐시’를 적층 구조로 구성한 것이다. 이렇게 하나의 다이에 적층 구조로 구성된 캐시의 양은 64MB이며, 이에 라이젠 9 7950X3D의 L3 캐시는 라이젠 9 7950X보다 정확히 64MB 더 많은 128MB다. 특히, 캐시 다이가 CPU 컴퓨트 다이 위에 적층 형태로, 최단거리로 구성됐기 때문에 캐시 증가분이 L4 등 별도의 단계가 아니라 L3 레벨에서 통합 가능했다. 한편, 이 ‘3D V-캐시’ 자체 성능 또한 이전 세대보다 더 높아진 것으로 알려졌다.

라이젠 9 7950X3D의 중요한 특징은 이 ‘3D V-캐시’가 두 개의 CPU 컴퓨트 다이 중 하나에만 적용됐다는 것이다. 이에 CPU 전체가 128MB의 L3 캐시를 공유할 수 있지만, 서로 다른 다이에 있는 코어나 캐시 자원에 접근하는 데는 성능이 떨어질 수밖에 없다. 이는 칩렛 구조를 사용한 라이젠, 에픽 프로세서에서 공통적으로 발견되는 특징이기도 하다. 또한 CPU 컴퓨트 다이에 3D V-캐시의 적용 여부에 따라 동작 속도와 성능 특성이 달라지고 이에 따른 작업 배분이 필요하다. 이 프로세서 또한 어떤 의미의 ‘하이브리드’라 볼 수 있는 이유다.

AMD가 두 개의 CPU 컴퓨트 다이 중 하나에만 ‘3D V-캐시’를 적용한 이유로는 현실적 이유가 있다. 일단 이 ‘3D V-캐시’를 적용해 가장 큰 성능 향상을 볼 수 있는 ‘게이밍’이 주로 8코어 정도까지만 사용한다는 부분이 꼽힌다. 이에 게이밍의 경우 스레드 배치 최적화를 통해 3D V-캐시가 적용된 코어 쪽에 작업을 할당함으로써 충분한 효과를 기대할 수 있다. 이는 인텔이 현재 코어 프로세서에서 퍼포먼스 코어 수를 ‘8개’에 맞추는 이유이기도 하다.

또한 3D V-캐시 적용 여부에 따라 다이 수준의 쿨링 문제 등을 고려해 개별 CPU 컴퓨트 다이의 최대 동작 속도 등이 달라진다. 라이젠 9 7950X3D에서도 두 개의 다이 간 최대 동작 속도가 다른데, 3D V-캐시의 적용 여부에 따라 다이의 최대 동작 속도와 기본 동작 속도가 약 0.5GHz 정도 차이난다. 이에 캐시보다 동작 속도가 더 중요한 경우에도 스레드 배치 최적화를 통해 더 조건이 좋은 코어 다이를 사용할 수 있다는 장점이 있다. 물론 또 다른 문제로는 다이에 캐시를 3D 적층 접합해 구성하는 비용 측면의 문제도 고려되었을 것이다.

또한 라이젠 9 7950X3D의 흥미로운 점은 ‘기본 TDP’ 구성이다. 라이젠 9 7950X가 최대 동작 속도 5.7GHz에 기본 TDP 170W 설정이지만 이 라이젠 9 7950X3D의 TDP는 120W로 오히려 낮아졌다. TDP가 120W로 낮아지면서 기본 동작 속도도 0.3GHz 낮게 설정됐다. 이런 설정들은 3D V-캐시가 적용된 다이의 동작 속도 한계 등을 감안해 조정한 것으로도 보인다. 한편, 단시간의 부스트를 위한 전력 제한은 162W 설정이 기본이며, PBO(Precision Boost Overdrive)를 활성화하는 경우 주요 전력 제한 설정들이 해제된다.

라이젠 7000 시리즈 프로세서부터는 새로운 플랫폼을 사용한다. / 권용만 기자
라이젠 7000 시리즈 프로세서부터는 새로운 플랫폼을 사용한다. / 권용만 기자
AMD의 ‘라이젠 7000’ 시리즈 프로세서에서 주목할 만한 또 다른 점은 ‘플랫폼’이다. 라이젠 7000 시리즈에서는 초대 라이젠부터 지금까지 사용되던 ‘AM4’ 소켓 기반 플랫폼 대신, 새로운 ‘AM5’ 소켓 기반 플랫폼을 사용한다. AM5 소켓 기반 플랫폼에서 가장 큰 변화는 ‘DDR5’ 메모리 전용 플랫폼으로의 변화가 꼽힌다. 프로세서의 PCIe 5.0 지원에 따라 플랫폼에도 이러한 변화가 반영됐다. 현재 사용 가능한 칩셋은 X670E/X670, B650E/B650 등이 준비되어 있다.

AM5 소켓은 이전 세대와는 다르게 핀이 메인보드 쪽에 있는 LGA(Land grid array) 형태를 사용한다. 이에 따라 이전 세대에서 프로세서나 쿨러 교체 시 사용자들이 겪던 난감한 상황들이 구조적으로 해결됐다. 쿨러 규격은 이전 세대의 AM4와 호환성을 유지해 AM4 지원 쿨러를 별다른 호환성 문제 없이 그대로 사용할 수 있다. 한편, AMD는 라이젠 7000 시리즈 이후 최소 2025년까지 몇 세대에 걸쳐 AM5 소켓 기반 플랫폼에 대한 호환성을 제공할 계획이라 밝힌 바 있다.

한편 데스크톱 PC를 위한 라이젠 7000 시리즈에서 눈에 띄는 변화 중 하나는 ‘프로세서 내장 GPU’다. 라이젠 7000 시리즈에는 내장 그래픽 활용이 특화된 APU 제품군이 아니더라도 I/O 다이에 RDNA2 세대의 프로세서 내장 그래픽이 들어간다. 이 내장 그래픽은 두 개의 컴퓨팅 유닛만을 갖춰 성능 측면에서는 그리 대단치 않지만, 4K 출력이나 AV1 영상 하드웨어 디코드 등 기본적인 컴퓨팅 수요를 위한 기능들을 충실히 제공하고, 하이브리드 그래픽 구성으로도 활용할 수 있다.

성능 향상 위한 특별한 접근법과 독특한 개성 눈길

Geekbench 5 테스트 결과, 높을수록 좋다. / 권용만 기자
Geekbench 5 테스트 결과, 높을수록 좋다. / 권용만 기자
Blender 3.4.0(CPU Benchmark) 테스트 결과, 단위 ‘분당 샘플 수’, 높을수록 좋다. / 권용만 기자
Blender 3.4.0(CPU Benchmark) 테스트 결과, 단위 ‘분당 샘플 수’, 높을수록 좋다. / 권용만 기자
Cinebench R23 테스트 결과, 높을수록 좋다. / 권용만 기자
Cinebench R23 테스트 결과, 높을수록 좋다. / 권용만 기자
테스트 시스템은 AMD 라이젠 9 7950X3D 프로세서와 에이수스 ROG 크로스헤어 X670E 히어로 메인보드, MSI MAG 코어리퀴드 C240 쿨러를 사용했다. 메모리는 현재 일반적인 사양인 삼성전자의 DDR5-4800 32GB 메모리 두 개로 듀얼 채널 64GB 구성했고, 별도 타이밍 조절 등은 하지 않았다. 그래픽카드는 인텔 아크 A770 16GB 리미티드 에디션을, 스토리지는 씨게이트 파이어쿠다 530 1TB NVMe SSD를 사용했다. 운영체제는 윈도11 22H2를, 드라이버는 메인보드 제조사 제공 최신 드라이버들을 사용했다.

프로세서의 기본 성능을 가늠할 수 있는 ‘긱벤치(Geekbench) 5’ 테스트 결과에서 AMD 라이젠 9 7950X3D 프로세서의 성능은 시장의 경쟁 상대라 할 만한 인텔 코어 i9-13900KS 대비로는 소폭 밀리는 모습이 보인다. 성능 차이는 싱글 스레드에서 5% 정도, 멀티스레드에서 10% 정도다. 일반적인 코어 i9-13900K와 비교하면 싱글 스레드에서는 동급, 멀티스레드에서는 약간 차이가 있을 것으로 예상된다.

한편, 두 프로세서의 멀티스레드 성능 극대화를 위한 접근 방법이 서로 다른 현재 상황에서 성능 수치만으로 단순히 우위를 결정하기는 쉽지 않은 모습이다. 워크로드의 성격에 따라 성능 차이는 다소 바뀔 수 있다. ‘블렌더(Blender)’ 3.4.0 버전 기반의 렌더링 성능 테스트는 라이젠 9 7950X3D 쪽이 약간이나마 우위에 있다. 특히 렌더링 씬에 따라 성능 차이가 보이는데, ‘monster’ 쪽은 양 프로세서 간 성능 차이가 거의 없지만, ‘classroom’ 쪽에서는 성능 차이가 벌어지는 모습을 확인할 수 있다.

멀티스레드 성능을 최대한 활용하는 렌더링 성능 테스트인 ‘시네벤치(Cinebench) R23’ 성능에서도 인텔의 13900KS 쪽이 소폭 앞서는데, 그 차이가 크지는 않다. 양 프로세서 간 싱글 코어 성능 차이는 15% 정도가 나타나지만, 멀티 코어 성능은 3% 정도로 좁혀진다. 한편, 라이젠 9 7950X3D의 경우 PBO 기능을 통해 전력제한 관련 주요 설정을 해제해도 메인 TDP 설정이 유지되고 실제 성능 차이도 아주 미미한데, 이는 3D V-캐시 적용에 따른 특징으로 보인다.

3DMark(Time Spy) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Time Spy) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Time Spy Extreme) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Time Spy Extreme) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(CPU Profile) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(CPU Profile) 테스트 결과, 높을수록 좋다. / 권용만 기자
게이밍 성능을 확인할 수 있는 3DMark 테스트 결과에서는 같은 그래픽카드에서도 라이젠 9 7950X3D 쪽이 제법 높은 성능을 냈다. 이는 프로세서 자체의 성능보다 ‘3D V-캐시’를 사용함으로써 메모리 시스템 등에서의 지연시간을 대폭 줄일 수 있었기 때문으로 보인다. ‘Time Spy’나 ‘Time Spy Extreme’ 모두에서 프로세서 연산 성능 쪽에서는 코어 i9-13900KS 쪽이 크게 높은데, 전체 점수는 라이젠 9 7950X3D쪽이 유의미하게 높은 모습이 보인다.

프로세서의 연산 성능 측면을 확인하는 3DMark의 ‘CPU Profile’ 테스트에서는 각 프로세서의 구성 특징에 따른 성능 추이를 확인할 수 있다. 먼저, 단일 스레드에서 8스레드까지는 코어 i9-13900KS쪽이 제법 높은 성능을 보인다. 이는 코어 i9-13900KS의 8개 퍼포먼스 코어 구성이 반영된 것으로, 퍼포먼스 코어 수준의 비교에서는 인텔의 ‘랩터 코브’가 ‘젠 4’보다 우위에 있는 모습이다.

하지만 16스레드 수준에서는 라이젠 9 7950X3D 쪽이 더 앞서는데, 이는 13900KS의 성능이 퍼포먼스 코어 8개, 에피션트 코어 8개 조합이지만 7950X3D는 온전한 ‘젠 4’ 코어 16개의 성능이 반영됐기때문이다. 전체 스레드 성능에서는 모든 물리 코어를 다 사용한 7950X3D 대비, 에피션트 코어 8개의 여유가 남은 13900KS 쪽이 더 높은 성능을 보인다.

Hitman World of Assassination 테스트 결과, 단위 fps, 높을수록 좋다. / 권용만 기자
Hitman World of Assassination 테스트 결과, 단위 fps, 높을수록 좋다. / 권용만 기자
Shadow of the Tomb Raider 테스트 결과, 단위 fps, 높을수록 좋다. / 권용만 기자
Shadow of the Tomb Raider 테스트 결과, 단위 fps, 높을수록 좋다. / 권용만 기자
PCMark 10 Extended 테스트 결과, 높을수록 좋다. / 권용만 기자
PCMark 10 Extended 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Night Raid - iGPU) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Night Raid - iGPU) 테스트 결과, 높을수록 좋다. / 권용만 기자
Geekbench 5(iGPU-OpenCL) 테스트 결과, 높을수록 좋다. / 권용만 기자
Geekbench 5(iGPU-OpenCL) 테스트 결과, 높을수록 좋다. / 권용만 기자
이러한 프로세서의 성능적 ‘개성’은 게임에 따라 다른 성능 차이를 만들기도 한다. 3DMark 쪽에서는 라이젠 9 7950X3D 쪽이 성능 우위에 있었지만, ‘히트맨: 월드 오브 어쌔시네이션’에서는 코어 i9-13900KS 쪽이 다소 나은 성능을 보이는 모습이다. ‘쉐도우 오브 더 툼레이더’에서는 두 프로세서 모두 동일한 성능을 보였으며, 그래픽카드의 부담을 줄이기 위한 옵션 조정에서도 같은 결과를 보였다. 대부분의 경우 이 두 프로세서 간 성능 차이는 사용자의 취향과 개성에 따라 평가가 갈라질 것으로 보인다.

다양한 PC 사용 시나리오에서의 성능을 반영하는 ‘PCMark 10’ 테스트에서도 라이젠 9 7950X3D의 ‘3D V-캐시’는 인상적인 모습을 보여 준다. 전체 점수에서부터 라이젠 9 7950X3D가 제법 높은 성능을 보여 주며, 특히 ‘생산성’과 ‘디지털 콘텐츠 제작’ 영역에서 격차를 확인할 수 있다. 세부 사항에서는 생산성 중 ‘스프레드시트’에서, 디지털 콘텐츠 제작에서는 ‘사진 편집’에서 큰 성능 차이가 보였다. 이러한 영역이 대용량 캐시를 갖춘 ‘라이젠 9 7950X3D’에서 장점을 극대화할 수 있는 부분이 될 것으로 보인다.

라이젠 7000 시리즈부터 새롭게 탑재되는 프로세서 내장 GPU는 2 CU(Compute Unit) 구성으로 그리 좋은 성능을 기대할 수준은 아니다. 3DMark 성능이나 긱벤치의 GPU 연산 성능 양 쪽에서 라이젠 9 7950X3D에 탑재된 내장 ‘라데온 그래픽스’는 13세대 코어 프로세서의 ‘UHD 그래픽스 770’의 80% 정도의 성능으로 나타난다. 물론, 게이밍이 아닌 부분에서는 충분히 실용적인 기능과 성능을 기대할 수 있을 것이다.

프로세서 성능 향상을 위한 새로운 방향을 제시한 ‘라이젠 9 7950X3D’ 프로세서 / 권용만 기자
프로세서 성능 향상을 위한 새로운 방향을 제시한 ‘라이젠 9 7950X3D’ 프로세서 / 권용만 기자
현재 PC에 사용되는 멀티코어 프로세서들의 ‘성능 향상’은 그리 단순한 문제가 아니다. 동작 속도를 올리는 데는 물리적인 한계가 있고, 코어 수를 늘리는 것 또한 언제나 효과적이지는 않다. 마이크로아키텍처의 발전 역시 호환성 등의 현실적인 문제로 매 세대마다 성능 도약을 선보이기 쉽지 않다. 그럼에도 지속적인 성능 향상을 달성할 수 있어야 PC 생태계가 유지될 수 있을 것이며, 이에 현재 PC용 x86 프로세서를 만드는 양 사의 고성능 프로세서 접근 전략은 꽤나 다른 모습을 갖춘 흥미로운 시대에 들어섰다.

AMD의 ‘라이젠 9 7950X3D’는 여러 모로 실험적 시도와 현실적 타협 사이의 절묘한 위치 선정이 인상적이다. 두 개의 CCD 중 한 쪽에만 3D V-캐시를 적용한 디자인은 두 가지 다이의 장점을 모두 취할 수 있게 했다. 그럼에도 두 코어 다이 모두 ‘젠 4’ 아키텍처 기반이라 최악의 스케줄링을 감안해도 성능에 대한 영향은 경쟁 제품 대비 제한적이다. 무엇보다 120W 급 TDP에서 16코어 구성의 성능을 제법 안정적으로 뽑아낼 수 있다는 점이 인상적인 부분이다.

사실 라이젠 9 7950X3D의 과제는 제품 자체보다는 제품 밖에 있다. 특히 가격 측면에서 AMD가 발표한 공식 가격은 699달러지만 현재 국내 시장가는 110만원을 훌쩍 넘기고 있다. 같은 발표 가격이었던 코어 i9-13900KS가 90만원에 살짝 못미치는 것에 비하면 다소 부담스러운 상황이다. AM5 기반 메인보드 또한 전반적으로 좀 더 높은 가격대에 형성되어 있다. 하지만 사용자의 워크로드 유형과 잘 어울린다면 기대 이상의 만족을 제공할 충분한 잠재력을 갖추고 있다. 특히 하이엔드 PC 사용자에게는 여러 모로 설레일 만한 제품이다.

권용만 기자 yongman.kwon@chosunbiz.com