인텔의 ‘코어 울트라’ 프로세서는 지금까지의 인텔 프로세서에서는 찾아보기 힘들었던 여러 변화들이 대거 등장했다. 새로운 마이크로아키텍처와 그래픽처리장치(GPU)는 물론이고, 시스템온칩(SoC)을 구성하는 방법도 기존의 단일 다이 기반에서 ‘칩렛(Chiplet)’ 방식으로 바뀌었으며, 각 기능별 ‘타일’의 제조 공정도 모두 다르다. 이러한 독특한 기술적 특징은 코어 울트라 프로세서가 새로운 수준의 성능과 효율성, AI 시대를 위한 가능성을 모두 갖출 수 있게 한 토대가 됐다.

인텔은 이 ‘코어 울트라’ 프로세서를 크게 열설계전력(TDP) 28W 기준의 ‘H 시리즈’, 15W 기준의 ‘U 시리즈’로 나눴다. 이 중 성능을 중시한 ‘H 시리즈’는 최대 6개의 퍼포먼스 코어를 포함, 최대 16코어 구성을 제공한다. 전력 효율성을 중시한 ‘U 시리즈’는 최대 2개의 퍼포먼스 코어를 포함, 최대 12개 코어 구성을 제공한다. 특히 ‘H 시리즈’의 경우, 제품의 세그먼트 기준은 28W 수준이지만 설계와 설정에 따라서는 지속 전력 65W, 순간 전력소비량 115W 수준의 고전력 고성능 구성도 충분히 가능하다. 

인텔 코어 울트라 7 프로세서를 탑재한 에이서 스위프트 고 14 노트북 / 권용만 기자
인텔 코어 울트라 7 프로세서를 탑재한 에이서 스위프트 고 14 노트북 / 권용만 기자

테스트로 살펴본 에이서 스위프트 고 14(SFG14-72) 모델은 인텔 ‘코어 울트라 7 155H’ 프로세서와 16GB의 LPDDR5-6400 메모리, 1TB NVMe SSD를 장착한 모델이다. 14인치의 OLED 디스플레이에 그리 부담스럽지 않은 크기와 무게를 갖췄음에도 플랫폼에서의 전력 설정은 제법 공격적이다. 저소음, 일반, 성능 등 세 가지 모드에서 각각 PBP(Processor Base Power) 35W, 45W, 65W 설정과 MTP(Maximum Turbo Power) 80W 설정을 사용한다. 이러한 공격적인 전원 설정을 뒷받침하기 위해, 전력 공급은 USB-PD로 100W를 받는다.

인텔 코어 울트라 7 155H 프로세서는 퍼포먼스 코어 6개, 에피션트 코어 8개와 저전력 에피션트 코어 2개 등의 구성으로 총 16코어를 갖췄다. 퍼포먼스 코어 기준 최대 동작 속도는 4.8GHz이고, 에피션트 코어는 최대 3.8GHz, 저전력 에피션트 코어는 최대 2.5GHz 정도로 설정됐다. 기본 열설계전력(TDP)은 28W이지만, 시스템 제조사의 디자인에 따라 20~65W 범위로 변경할 수 있다. MTP는 최대 115W까지 사용할 수 있다. 프로세서에 탑재된 캐시는 총 24MB, 메모리는 DDR5-5600 혹은 LPDDR5/x-7467까지 지원하고 듀얼 채널 구성에서 최대 용량은 96GB다.

프로세서에 탑재된 GPU는 8개 Xe 코어 구성의 ‘아크(Arc) 그래픽스’로, 최대 동작 속도는 이전 세대 제품보다 제법 오른 2.25GHz다. 다이렉트X 12.1과 레이 트레이싱 등의 최신 기술을 지원하며, AV1 코덱의 하드웨어 인코딩과 디코딩 모두 가능하다. 탑재된 NPU ‘인텔 AI 부스트’는 최대 1.4GHz로 동작하며, 지원하는 데이터 타입은 INT8, FP16, FP32다. 오픈비노(OpenVINO)나 ONNX RT 이외에도 윈도ML, 다이렉트ML을 지원해 범용성을 높였으며, 윈도 스튜디오 이펙트도 지원한다.

Cinebench 2024 테스트 결과, 높을수록 좋다. / 권용만 기자
Cinebench 2024 테스트 결과, 높을수록 좋다. / 권용만 기자
Blender 4.0.0(CPU) 테스트 결과, 단위 ‘분당 샘플 수’, 높을수록 좋다. / 권용만 기자
Blender 4.0.0(CPU) 테스트 결과, 단위 ‘분당 샘플 수’, 높을수록 좋다. / 권용만 기자
PCMark 10 테스트 결과, 높을수록 좋다. / 권용만 기자
PCMark 10 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(Productivity) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(Productivity) 테스트 결과, 높을수록 좋다. / 권용만 기자

코어 울트라 7 155H의 연산 성능 측면을 확인할 수 있는 ‘시네벤치 2024(Cinebench 2024)’와 ‘블렌더(Blender) 4.0’의 결과에서는 제법 준수한 성능을  확인할 수 있다. 이전 세대나 경쟁 모델과 비교하면, 코어 울트라 7 155H의 성능은 싱글 스레드 측면에서는 상당한 경쟁력을 갖추고 있고, 멀티 스레드 성능에서는 기대치와 경쟁 제품 대비로는 조금 아쉬울 수도 있겠다. 하지만 외부 전원이 연결된 ‘퍼포먼스’ 모드에서는 기대했던 수준의 성능을 선보이며, 테스트에 사용한 노트북 폼팩터에서 예상했던 것보다는 더 나은 성능을 보였다.

테스트 환경에서 나타난 특이점이라면, 일부 테스트에서 노트북의 쿨링 정책 설정 ‘성능’과 ‘일반’ 간에 큰 성능 차이가 나타났다는 것이다. 특히 CPU의 멀티쓰레드 성능을 집중적으로 활용하는 상황에서 크게는 50% 정도까지 성능이 떨어지는 모습이 확인된다. 이는 내부적으로 전력 제한 설정의 경계선상에서 CPU 내부 코어 활용 정책의 영향으로 추정된다. 한편, 그래픽 성능은 노트북 쿨링 정책 설정의 변화에도 상대적으로 영향을 덜 받고, 다양한 실제 워크로드 기반 테스트에서는 쿨링 정책 설정간 성능 차이가 이 정도로 극단적으로 나타나지는 않는다.

다양한 PC 활용 상황에서의 성능을 확인하는 ‘PC마크 10’의 결과는 CPU 연산 위주의 결과보다 더 긍정적인 모습이다. 특히, 노트북 쿨링 정책상의 성능 변화도 전체적으로는 10% 정도, 가장 크게 나타난 ‘디지털 콘텐츠 제작’ 부분에서도 15% 정도로 나타났다. 이 정도면 지금까지의 여느 노트북들과 비교해도 큰 차이 없는 수준이다. 특히 GPU 성능은 모드별 차이가 없는 수준이다. 마이크로소프트 오피스와 어도비 크리에이티브 클라우드를 직접 사용하는 ‘UL 프로시온(Procyon)’ 테스트에서도 전반적으로는 준수한 성능과 함께 쿨링 정책별 차이도 5% 이내로 나타났다. 

3DMark(Time Spy) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Time Spy) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Time Spy Extreme) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark(Time Spy Extreme) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark (DirectX Ray Tracing) 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자
3DMark (DirectX Ray Tracing) 테스트 결과, 단위 ‘초당 프레임 수’, 높을수록 좋다. / 권용만 기자
3DMark (CPU Profile) 테스트 결과, 높을수록 좋다. / 권용만 기자
3DMark (CPU Profile) 테스트 결과, 높을수록 좋다. / 권용만 기자

그래픽과 게이밍 성능을 확인할 수 있는 ‘3D마크(3DMark)’ 테스트에서는 제법 인상적인 결과를 확인할 수 있다. 코어 울트라 7 155H의 ‘아크 그래픽스’는 다이렉트X 12(DirectX 12) 기반의 테스트인 ‘타임 스파이(Time Spy)’에서 총점 3959점을 받았는데, 이는 AMD 라이젠 7040 시리즈의 ‘라데온 780M’ GPU가 2800~3000점 정도가 나오는 것에 비해 30% 이상 높은 성능이고, 아직도 많이 사용되는 지포스 GTX 1060, 1650 그래픽카드의 수준까지 올라온 것이다. 또한 ‘레이 트레이싱’을 내장 그래픽 코어에서도 사용할 수 있지만, 실제 사용하기에는 성능이 아쉽다.

그래픽 성능에서는 노트북 쿨링 정책상 성능 변화가 상대적으로 적게 나타나는 모습이다. ‘타임 스파이’ 테스트에서 쿨링 정책 ‘성능’과 ‘일반’ 사이의 총점 차이는 4% 정도고, 그래픽 성능 점수는 오차범위 이내다. 하지만 CPU 성능 측면에서는 30% 정도의 차이를 확인할 수 있다. 이 차이는 ‘타임 스파이 익스트림’에서 좀 더 커진다. 전체 성능 차이는 15% 정도지만 그래픽 성능 차이는 10%에 그치는 데 비해, CPU 성능은 절반 이하로 떨어지는 경우를 볼 수 있다.

3D마크의 ‘CPU 프로파일(CPU Profile)’ 테스트에서는 하이브리드 아키텍처의 특징과 쿨링 정책상 성능 변화 양 쪽을 한 번에 확인할 수 있다. 싱글 코어 성능은 2스레드까지 그대로 유지되다가 4스레드 이후 조금씩 배율이 줄어들어, 16스레드시 성능은 싱글스레드 대비 6.9배, 전체 멀티스레드 성능은 싱글스레드 대비 약 7.4배 정도로 나타났다. 쿨링 정책상 성능 변화 측면에서는 ‘성능’과 ‘일반’ 모드 사이 싱글 스레드 성능은 5% 정도 차이지만 스레드 수가 늘어날 수록 차이가 커져서 16스레드에서는 40% 정도 차이가 나타나는 모습이다.

UL Procyon(AI Inference - Windows ML) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Inference - Windows ML) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Inference - OpenVINO) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Inference - OpenVINO) 테스트 결과, 높을수록 좋다. / 권용만 기자
Stable Diffusion 1.5(GIMP 2.99) 테스트 결과, 단위 ‘초’, 낮을수록 좋다. / 권용만 기자
Stable Diffusion 1.5(GIMP 2.99) 테스트 결과, 단위 ‘초’, 낮을수록 좋다. / 권용만 기자

새로운 ‘코어 울트라’의 등장에서 중요하게 주목받는 부분 중 하나는 ‘AI’다. 이 부분에서 인텔은 PC에서의 로컬 AI 추론을 NPU에 모두 맡기기보다는 CPU와 GPU, NPU를 모두 활용하는 ‘이종 가속 환경’을 추구한다. 이는 이론적으로도 가장 효율이 높은 방법이며, 현실적으로도 가장 실용적인 접근이다. UL 프로시온(Procyon)의 AI 추론 벤치마크 결과에서, NPU의 성능은 CPU보다는 수 배 빠르지만, GPU보다는 조금 뒤지는 정도로 나타난다. 또한 아직 ‘오픈비노’ 기반 성능보다 ‘윈도ML’ 기반의 성능이  제법 크게 뒤지는 것도 확인할 수 있다.

이런 CPU와 GPU, NPU간 성능에 따른 역할의 위치는 AI 기반 이미지 생성 ‘스테이블 디퓨전(Stable Diffusion)’ 모델에서 잘 확인할 수 있다. 이 테스트에서는 인텔이 ‘오픈비노’를 기반으로 NPU 활용이 가능하도록 최적화한 버전을 이용했고, GIMP 2.99 개발 버전을 인터페이스로 활용했다. 이 테스트에서 가장 빨리 이미지를 처리한 것은 ‘GPU’만을 사용하는 것으로, CPU만을 사용한 것보다는 7.3배 가량 빨리 작업을 끝냈다. 

이 모델은 크게 텍스트 프롬프트 해석과 이미지 생성 추론, 이미지 디코드의 세 가지 부분으로 진행되는데, 이 부분 중 NPU가 적용 가능한 부분은 이미지를 생성하는 추론 영역만이다. CPU를 텍스트 디코드에, GPU를 이미지 디코드에 할당하고 NPU를 이미지 생성 추론에 할당했을 때는 GPU대비 두 배 정도 더 긴 33초가 걸렸지만, 이 경우 CPU와 GPU의 부담을 최소화해 발열과 배터리의 부담이 최소화되는 점이 장점이다. 이미지 생성 추론에 GPU와 NPU를 동시에 할당했을 때는 배터리와 발열 부담을 크게 줄이면서도 GPU급 성능을 얻을 수 있다.

Image Enhancement Test 테스트 결과, 단위 ‘초’, 낮을수록 좋다. / 권용만 기자
Image Enhancement Test 테스트 결과, 단위 ‘초’, 낮을수록 좋다. / 권용만 기자
Adobe Premiere Pro 2024(4K Video Export) 테스트 결과, 단위 ‘초’, 낮을수록 좋다. / 권용만 기자
Adobe Premiere Pro 2024(4K Video Export) 테스트 결과, 단위 ‘초’, 낮을수록 좋다. / 권용만 기자

이미지 기반 전문 작업에 보편적으로 사용되는 어도비의 윈도 환경 기반 애플리케이션들은 현재 AI 관련 기능에 GPU를 주로 사용한다. 어도비 라이트룸 클래식의 ‘노이즈 제거’ 기능의 경우 DSLR로 촬영한 이미지 두 장의 노이즈 제거에 183초가 걸렸는데, 이는 데스크톱의 ‘아크 A770’ 대비 시간이 몇 배 정도 더 걸린 것이다. 이는 GPU 자체의 성능 차이와 프레임워크 수준의 최적화 문제, 테스트 시스템의 메모리 부족 문제가 모두 관련된 것으로 보인다. 한편, ‘토파즈 기가픽셀 AI(Topaz Gigapixel AI)’의 4배 업샘플링에서는 데스크톱과 동급 성능이 나왔다.

영상 편집 환경에서 보편적으로 사용되는 어도비의 ‘프리미어 프로’ 환경에서도 코어 울트라는 제법 준수한 성능을 보여준다. 4K 샘플 영상의 익스포트 성능에서 테스트 시스템은 고성능 데스크톱 대비 약 65~70% 정도의 성능을 보이는데, 프로세서 내장 그래픽에 메모리 용량을 고려하면 나름대로 납득 가능한 수준의 성능이다. 지금까지 프리미어 프로에서 인텔의 ‘아크’ 계열 그래픽카드의 하드웨어 가속 기능을 제대로 사용할 수 없었던 부분도, 프리미어 프로 24버전에서 인텔 아크 그래픽카드의 하드웨어 가속을 공식 지원함으로써 해결됐다. 

‘AI PC’ 시대의 서막 열 ‘인텔 코어 울트라’ 프로세서 / 권용만 기자
‘AI PC’ 시대의 서막 열 ‘인텔 코어 울트라’ 프로세서 / 권용만 기자

인텔 ‘코어 울트라’의 등장은 여러 모로 새로운 ‘AI PC’ 시대를 본격적으로 여는 계기가 될 것으로 기대된다.

NPU 탑재는 경쟁사들이 먼저 나섰지만, 인텔은 코어 울트라의 출시와 함께 향후 2년간 약 1억 대의 NPU 탑재 디바이스를 시장에 공급하면서 본격적으로 생태계를 넓혀 갈 것이라 밝힐 정도로 시장 확대에 적극적으로 나서고 있다. 이는 지금까지 여러 대외 요인에 따라 침체된 PC 시장의 수요를 되살리고, 윈도10의 지원 종료를 앞두고 쏟아져 나올 것으로 기대되는 새로운 PC 수요를 자연스럽게 흡수하면서 새로운 시대로의 전환을 이끌 것으로 예상된다.

꼭 ‘AI’가 아니더라도, 코어 울트라는 인텔의 프로세서가 가지고 있던 오랜 숙제들을 상당 부분 해결하는 계기를 만들었다는 부분에서 인상적이다.

프로세서의 체감 전력 효율도 제법 올랐고, 프로세서 내장 GPU의 기능과 성능 향상도 고무적이다. 이러한 새로운 특징들은 이전 세대 대비 상품성 차별화와 함께 경쟁사의 제품 대비로도 높은 경쟁력을 보일 것으로 기대된다. 물론 플랫폼의 전력 설정에 따라 일부 상황에서의 성능 편차가 크게 나타나는 부분은 초대 코어 울트라를 사용하는 노트북 제품 디자인의 숙제가 될 것으로 보인다. 

AI로 인한 변화는 이미 PC 시장에 영향을 미치기 시작했고, 주요 프로세서 제조사들은 메인스트림 노트북용 플랫폼에 AI를 위한 ‘NPU’를 탑재한 제품을 본격적으로 선보였다. AI 기반 애플리케이션들도 빠르게 늘어나고 있으며, 2024년에 선보일 윈도11의 대형 업데이트나 차기 윈도 버전에서도 AI 관련 기능의 비중이 크게 높아질 것으로 예상된다.

여러 모로 2024년 PC 시장은 이전과는 확연히 구분되는 ‘대전환’의 시기가 될 것으로 보인다. 새로운 ‘코어 울트라’는 새로운 AI PC 시대에 이전 세대와는 확실한 차별점을 보여 줄 것으로 기대된다.

권용만 기자 yongman.kwon@chosunbiz.com

관련기사