“모두의 AI 위한 만능 레시피” 인텔 코어 울트라 200V

NPU·GPU·CPU 삼박자…얇고 가볍고 하루 종일 가는 배터리

2025-09-16     권용만 기자

인공지능(AI)은 IT를 넘어 사회 전반을 뒤흔드는 변화의 핵심으로 부상했고, PC 시장도 ‘AI PC’ 전환의 최전선에 섰다. 그래픽처리장치(GPU)가 AI 혁신을 주도해왔지만 PC에서는 여전히 한계가 뚜렷하고, 이에 따라 신경망처리장치(NPU)를 갖춘 ‘코파일럿+ PC’ 개념이 주목받고 있다. 동시에 인텔과 AMD GPU 최적화가 늘어나면서 GPU 기반 AI 가속도 점차 보편화되고 있다. 이런 흐름 속에서 인텔의 차세대 ‘코어 울트라 200V(루나 레이크)’는 고효율·초박형 설계와 하루 종일 가는 배터리, NPU·GPU 모두를 갖춘 AI 만능 플랫폼으로 자리매김한다. AI 시대 일상의 PC 경험을 가장 완성도 있게 담아낸 제품이라는 평가가 뒤따른다.

얇고 가벼운 프리미엄 급 AI 노트북 PC에 최적화된 인텔 ‘코어 울트라 200V 시리즈’ / 권용만 기자

만능 AI PC 위한 모든 조건 갖춘 ‘루나 레이크’

인텔의 ‘코어 울트라 시리즈 2’ 제품군 중에서도 코드명 ‘루나 레이크(Lunar Lake)’로 알려진 ‘코어 울트라 200V 시리즈’는 여러 모로 특별한 제품이다. 기존의 노트북 PC를 바라보는 기준에서 볼 때도 코어 울트라 200V 시리즈는 지금까지의 인텔 프로세서 중 최고로 꼽히는 전력 효율과 함께 최신 아키텍처가 아낌없이 들어간 점에서 차별화된다. 표준 17W, 최대 37W의 낮은 열설계전력(TDP) 설정에도 더 높은 전력 소비량 설정을 사용하는 제품들 대비 손색없는 성능을 갖췄다.

인텔의 코어 울트라 200V 시리즈는 지난해 하반기 발표 직후 얇고 가벼운 프리미엄 노트북 PC 시장과 AI PC, 마이크로소프트의 ‘코파일럿+ PC’ 시장 모두를 장악할 정도로 큰 인기를 모았다. 이렇게 큰 관심을 모은 이유로는 기존의 기준에서도 준수한 성능에 훌륭한 전력 효율, 고성능 NPU 탑재를 통한 ‘코파일럿+ PC’ 대응에 대한 기대감 등이 꼽힌다. 특히 코어 울트라 200V 시리즈를 탑재한 제품들이 실제 하루를 충전 없이 쓸 수 있는 ‘올데이 컴퓨팅’을 제공하는 점이 많은 관심을 모았다.

현재 PC 시장 변화의 핵심인 ‘AI PC’로의 관점에서 가장 주목받는 요소는 ‘신경망처리장치(NPU)’다. 코어 울트라 200V 시리즈는 이 부분에서도 현재 인텔의 프로세서로는 유일하게 모비디우스의 4세대 설계 기반 NPU를 탑재해 40TOPS(초당 40조회 연산) 성능 이상이 필요한 마이크로소프트의 ‘코파일럿+ PC’ 기준을 충족한다. ‘코파일럿+ PC’에서는 강력한 NPU 성능을 바탕으로 이미지 생성이나 실시간 번역, 사용자의 작업 상황을 쉽게 검색할 수 있게 하는 ‘리콜’, 원하는 작업의 방법이나 순서 등을 알려 주는 ‘클릭 투 두’ 기능 등을 사용할 수 있다.

인텔 코어 울트라 200V 시리즈의 GPU 주요 특징 / 인텔

코어 울트라 200V 시리즈의 특지으로 그래픽처리장치(GPU)는 그리 크게 주목받지 못했다. 하지만 PC에서 AI를 현실적으로 활용하는 데 있어 현재 가장 보편적으로 활용되는 방법은 GPU다. 특히 GPU에서 최신 AI 모델을 활용하는 데 있어서는 전통적인 쉐이더나 코어 수를 따지는 것 이상으로, 행렬 연산을 위한 처리 장치가 얼마나 갖춰져 있는지가 중요한 시대가 됐다. 전통적인 그래픽 중심 기준에서는 더 높은 성능을 기대할 수 있을지라도, 행렬 연산을 위한 코어 역량이 부족하면 AI에서 좋은 결과가 나오지 않는다.

코어 울트라 200V 시리즈에는 인텔의 프로세서에서는 처음으로 2세대 Xe 아키텍처 ‘배틀메이지(Battlemage)’ 기반 아크 시리즈 GPU가 탑재됐다. 이 ‘배틀메이지’는 이전 세대 대비 효율성을 높인 새로운 아키텍처를 통해, 그래픽 처리 성능에서는 이전 세대 대비 50% 정도 향상된 성능을 제공한다. AI의 행렬 연산 처리를 위한 ‘XMX(Xe Matrix Extension)’를 지원해 AI 처리 성능을 크게 높였다. 이 ‘XMX’는 외장형 아크 그래픽카드나 ‘코어 울트라 2세대’ 제품군 중 ‘애로우 레이크-H’등 일부 제품에서도 제공되고 있다.

인텔의 XMX는 512비트 폭인 기본 벡터 엔진보다 4배 넓은 2048비트 처리 폭을 갖췄다. 단순히 생각하면 XMX는 행렬 연산이 주를 이루는 AI 워크로드에서 처리 성능을 최대 4배까지 올려줄 수 있는 셈이다. 실제 최신 세대 GPU의 AI 성능은 벡터 엔진 구성보다 ‘텐서 코어’나 ‘XMX’, ‘매트릭스 코어’ 등으로 불리는 이 행렬 연산용 처리 장치의 성능에 큰 영향을 받는다. 인텔 코어 울트라 200V의 최대 플랫폼 AI 성능은 120TOPS인데, 이 중 GPU가 차지하는 비중은 53% 정도인 67TOPS 정도에 이른다.

경쟁사의 비슷한 세대 아키텍처와 비교했을 때, 인텔의 XMX는 연산 측면에서 높은 경쟁력을 갖췄다. XMX가 탑재된 아크 GPU의 기본 그래픽 처리 성능은 엔비디아나 AMD의 제품들과 비슷하거나 조금 뒤쳐지기도 했지만, XeSS나 FSR 등 XMX를 활용하는 AI 업샘플링 기슬의 역량에서는 높은 경쟁력을 보였던 바 있다. 특히 AMD의 GPU와 비교해서는 같은 FSR을 사용해도 인텔의 GPU쪽이 확실히 체급 이상의 모습을 보이며 행렬 연산 성능에서 한 세대 이상 앞선 것으로 평가된 바 있다. 이런 측면은 노트북의 프로세서 내장 GPU에서도 그대로 이어지는 모습이다.

인텔 코어 울트라 258V 프로세서와 32GB 메모리가 탑재된 환경에서 ‘AI 플레이그라운드’로 ‘gpt-oss 20B’ 모델 구동 모습 / 권용만 기자

AI 활용에 있어 코어 울트라 200V 시리즈 내장 아크 GPU의 또 다른 장점은 ‘메모리’다. 인텔의 프로세서 내장 그래픽은 전통적으로 시스템에 탑재된 메모리의 절반까지 필요에 따라 동적으로 할당해 사용할 수 있었다. 최신 세대 드라이버에서는 이러한 제약이 좀 더 완화돼 현재는 32GB 메모리를 탑재한 코어 울트라 200V 시리즈 제품의 경우 그래픽에 최대 18GB(기가바이트)까지 메모리를 할당할 수 있다. 이 정도면 절대 성능에서는 차이가 있지만 고성능 외장 그래픽카드에서 메모리 부족으로 다루지 못할 크기의 모델까지 쓸 수 있을 정도다.

이에 따라, 32GB 메모리를 탑재한 코어 울트라 200V 시리즈 제품에서는 최근 오픈AI(OpenAI)가 공개한 gpt-oss 20B 모델도 충분히 내장 그래픽으로 써볼 수 있다. 이 gpt-oss 20B 모델은 4비트 양자화 모델에서 용량이 13GB에 조금 못미치는 수준인데, 이 정도면 외장 그래픽카드에서는 16GB 메모리를 갖춘 고성능 제품군이 필요하다. 하지만 프로세서 내장 그래픽에서는 32GB 메모리를 갖추고 있다면 상대적으로 무리 없이 모델을 불러와 실용적인 성능으로 쓸 수 있다. 이 부분은 모델 발표 직후 경쟁사들이 경쟁적으로 발표한 바 있는데, 인텔도 바로 사용할 수 있다.

소프트웨어 지원 상황 또한 꾸준히 개선되고 있다. 파이토치 등 주요 프레임워크에는 인텔이 최적화한 버전이 제공되고 있고, 이를 채택한 소프트웨어도 늘어 가는 추세다. AI 프레임워크에서도 오픈비노(OpenVINO) 뿐만 아니라 ONNX 등 시장의 실질적 표준 환경을 모두 지원하고 있다. PC에서 AI 모델을 쉽게 쓸 수 있게 해 주는 ‘AI 플레이그라운드’ 앱에서는 이제 딥시크 모델에 이어 ‘gpt-oss’ 모델의 지원이 추가됐고, 마이크로소프트 파이3.5 등의 모델은 NPU로만 구동할 수 있게 준비됐다. 개발사가 ‘쿠다’만 지원하는 게 아니라면 다양한 우회 경로가 가능한 셈이다.

코어 울트라 200V 시리즈 플랫폼의 AI 성능 / 인텔

CPU-GPU-NPU 모두 활용한 가지각색 AI 활용 환경

현재 많은 사람들이 클라우드를 통해 PC에서 AI를 쓰고 있다. 이는 PC에서 작업을 요청하면 실제 처리는 클라우드에서 하고 PC에서는 결과만 받는 것이다. 이 방법은 PC에 부담이 적고 편리하며 성능도 훌륭하지만, 클라우드로 데이터가 오가야 되는 만큼 민감한 데이터에서는 보안 측면이 우려되고, 큰 데이터에서는 네트워크 비용에 대한 우려도 있다. 반면 PC에서 직접 모델을 구동하는 ‘온디바이스 AI’의 경우 PC의 자원만을 사용하는 만큼 추가 서비스 비용이나 데이터 보안 문제, 네트워크 연결성 등을 따질 필요가 없지만, PC 사양이나 구성 등에서 기술적인 어려움이 남아 있다.

일반적으로 AI를 구동한다고 하면 GPU, 특히 엔비디아의 GPU를 떠올리는 경우가 많지만 PC, 특히 노트북 PC에서는 상황이 다르다. 언제나 들고 다닐 수 있는 얇고 가벼운 노트북 PC에는 대부분 엔비디아의 외장 GPU가 장착되지 않는다. 엔비디아의 외장 GPU는 성능 위주로 구성돼 소비전력과 발열이 크고, 게이밍이나 워크스테이션 등 제법 크고 두꺼운 제품에 탑재된다. 외장 GPU를 사용하면 배터리 사용 시간 또한 크게 짧아진다. 엔비디아는 현재 AI PC 시장을 위한 프로세서 제품군이 없고, 엔트리급 GPU 제품은 현 세대 프로세서 내장 그래픽 대비 큰 장점이 없다.

인텔의 ‘코어 울트라 2세대’ 제품군은 AI 노트북 PC 시장에서 현재 선택 가능한 최선의 기술적 구성을 갖췄다. ‘루나 레이크’는 준수한 성능과 고효율이 돋보이고, ‘애로우 레이크’는 강력한 프로세서와 GPU 성능 경쟁력이 눈에 띈다. 경쟁사인 AMD와 비교하면 내장 그래픽의 AI 연산 능력에서는 인텔 쪽이 동급 제품에서 분명한 우위를 제공한다. 엔비디아와 비교하기에는 엔비디아의 GPU는 ‘외장’으로만 제공되고 있어 노트북의 크기와 무게, 가격대 자체가 달라진다. 

UL Procyon(AI Computer Vision: OpenVINO) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Image Generation) 테스트 결과, 높을수록 좋다. / 권용만 기자
UL Procyon(AI Text Generation) 테스트 결과, 높을수록 좋다. / 권용만 기자

인텔 코어 울트라 200V 시리즈 프로세서 기반 노트북 PC에서 AI 활용 테스트 시스템으로는 에이수스의 ‘젠북 S 14 OLED’ 모델을 사용했다. 이 제품에는 코어 울트라 7 258V 프로세서와 32GB 메모리, 512GB SSD가 탑재됐다. 운영체제는 마이크로소프트 윈도11 24H2 버전을 사용했고, 드라이버는 제조사 지원 최신 버전에 NPU 드라이버만 인텔 홈페이지에서 제공하는 최신 버전으로 업데이트했다. 제품 전력 설정은 외부 전원 연결의 ‘밸런스’와 ‘퍼포먼스’ 모드를 사용했다.

UL 프로시온(Procyon)의 AI 테스트에서 인텔 코어 울트라 200V 시리즈는 인텔의 오픈비노와 윈도의 ONNX 기반 윈도ML 환경을 사용할 수 있는데, 오픈비노 쪽의 결과가 제법 더 높게 나온다. 오픈비노를 사용한 코어 울트라 200V 시리즈는 윈도ML 기반의 경쟁 제품보다 크게는 몇 배까지 성능 차이가 나타나기도 한다. NPU 성능도 정수 연산 기준에서는 ‘코파일럿+ PC’ 기준을 만족하는 다른 제품들에 손색 없고, 데이터 유형 지원 폭에서는 좀 더 나은 모습이다.

AI 이미지 생성은 인텔이 NPU를 탑재한 코어 울트라 시리즈를 처음 선보일 때부터 오픈비노 프레임워크에서 제법 공을 들인 부분 중 하나였다. 특히 양자화로 경량화된 모델에서 GPU와 NPU를 동시에 사용해 워크로드를 분산시키고 전체 성능을 올리는 처리 방법은 현재 인텔 정도만 지원한다. UL 프로시온의 AI 이미지 생성 테스트에서도 NPU 위주의 사용이라도 실질적으로는 파이프라인 중 VAE(Variational Autoencoder)는 GPU가 담당하는 설정이 사용된다. 이렇게 GPU와 NPU를 함께 사용해, 코어 울트라 200V 시리즈는 이미지 생성에서 메인스트림 급 외장 GPU 수준의 성능을 제공한다.

UL 프로시온의 AI 텍스트 생성 테스트는 GPU 기반 범용 프레임워크를 기반으로 하지만, 이 또한 훌륭한 성능을 보인다. 이 부분은 범용 프레임워크에 이미 인텔이 XMX 기반 최적화를 제공한 점들이 반영된 것이다. 현재 코어 울트라 2세대 제품군의 내장 GPU에 XMX가 탑재된 부분은 PC에서 거대언어모델(LLM)을 활용하는 데 있어 경쟁 제품들 대비 성능과 지원의 유연성에서 우위를 기대할 수 있을 부분이다. 

LLM Chat Performance Test, 단위 ‘초당 토큰 수’, 높을수록 좋다. / 권용만 기자

인텔의 ‘AI 플레이그라운드’ 앱은 주요 LLM이나 이미지 생성 모델들을 구동 환경까지 한 번에 쉽고 편리하게 설치, 활용할 수 있게 한다. 인텔은 이 ‘AI 플레이그라운드’ 앱을 2024년 7월 처음 선보인 이후 꾸준히 업데이트했고, 지난 8월 21일 선보인 2.6.0b 모델에서는 Llama.cpp 백엔드에서 ‘gpt-oss 20B Q8’ 모델을 사용할 수 있게 됐다. 이 앱이 사용하는 Llama.cpp 백엔드를 직접 구성할 수도 있겠지만, 인텔 프로세서 기반 PC에서는 ‘AI 플레이그라운드’ 앱을 사용하는 것이 가장 쉽고 확실한 방법이 될 것이다.

‘gpt-oss 20B’ 모델은 8비트 양자화된 경우에도 그래픽 메모리가 12GB 이상 필요하다. 이에 외장 그래픽의 경우 16GB 메모리가 장착된 고가의 고성능 모델을 사용해야 한다. 하지만 프로세서 내장 그래픽에 공유 메모리 구조를 사용하는 경우에는 32GB 이상의 메모리가 장착돼 있다면 일단 모델 전체를 그래픽 메모리에 올려 처리할 수 있다. 테스트에 사용한 코어 울트라 7 258V 프로세서의 경우 gpt-oss 20b Q8 모델에서 대략 초당 17토큰 정도의 실용적인 성능을 얻을 수 있었다. 이보다 작은 7B급 모델의 경우 GPU와 NPU로 초당 20토큰 이상의 성능을 기대할 수도 있다.

현재 인텔의 GPU, NPU 지원에서 핵심은 ‘오픈비노’지만, 이외의 지원 폭도 확장되고 있다. 이미 파이토치 등의 주요 프레임워크에는 인텔의 하드웨어 지원이 네이티브로 포함돼 있어, 이를 포함한 배포판을 사용하면 쉽게 하드웨어 가속 지원을 활용할 수 있다. LM 스튜디오(LM Studio) 환경에서는 GPU 활용에 ‘벌칸(Vulcan)’을 사용하는 방법도 제공하는데, 인텔의 내장 GPU에서 이를 활용했을 때도 gpt-oss 20B 모델에서 기대 이상 준수한 성능을 확인할 수 있었다. 이제 LLM 지원에서 엔비디아 GPU만 가능한 상황은 확연히 줄고 있다.

한편, 3~4B(30~40억 파라미터)급의 소규모 모델은 굳이 GPU 가속의 도움을 받지 않고도 코어 울트라 200V 시리즈의 프로세서 성능만으로 충분히 실용적인 성능을 낼 수 있다. 젠스파크(Genspark)의 ‘젠스파크 브라우저’에서 제공하는 ‘온디바이스 프리 AI’가 주요 소규모 오픈 모델들을 프로세서 성능으로 구동하는 것이 대표적인 사례다. 이 경우 대략 3~4B 모델 정도까지는 프로세서 성능이나 메모리 용량 등에 큰 부담이 느껴지지 않지만, 7B 이상 규모의 모델부터는 다소 사용이 어려운 수준이 된다. 하지만 간단한 모델 정도는 꼭 GPU만 생각할 필요도 없을 시대가 됐다.

인텔 프로세서 내장 아크 140V 그래픽으로 SD넥스트를 통해 스테이블 디퓨전 XL을 구동한 모습 / 권용만 기자

인텔의 ‘코어 울트라 2세대’ 기반 PC를 사용하고 있다면 이미지 생성에서도 ‘AI 플레이그라운드’를 사용하는 것이 가장 편리하다. 하지만 다른 방법이 없는 것은 아니다. 컴피UI(ComfyUI)나 SD넥스트(SDNext) 웹UI 등 주요 환경에서도 인텔의 하드웨어 기반 환경을 지원해, 더욱 다양한 최신 모델을 활용할 수 있다. 이 중 ‘컴피UI’는 ‘AI 플레이그라운드’에도 옵션으로 통합 제공될 정도고, ‘SD넥스트’는 인텔 최적화 파이토치 라이브러리 등을 직접 활용하고 있다.

이 중 ‘SD넥스트’를 실제 설치해 활용해 봤다. 설치 전에는 파이썬(Python) 환경을 미리 설치해둘 필요가 있고, 파이썬 환경 등이 제대로 설치됐다면 설명서에 따라 명령어 몇 줄로 쉽게 설치할 수 있다. 서버가 구동되고 나면 웹 브라우저에서 모델을 고르고 이미지를 생성할 수 있다. 실제로 일반적인 모델을 골라서 이미지 생성을 했을 때, GPU를 적극적으로 활용하는 모습을 확인할 수 있었다. 이제 최신 프로세서의 내장 그래픽으로 이미지 생성도 충분히 가능한 수준이 됐다.

한편, 코어 울트라 200V 시리즈 프로세서 기반 PC라면 로컬 PC에서의 이미지 생성에 ‘코파일럿+ PC’의 ‘이미지 크리에이터’ 등 내장 기능을 활용하는 것도 편리한 방법이다. 최신 윈도의 기본 기능인 만큼 별도의 까다로운 설치 과정도 없다. 이 기능들은 상대적으로 작은 크기의 모델을 NPU로 구동하는 만큼 생성할 수 있는 이미지의 크기나 품질에는 어느 정도 한계가 있지만 실용적인 활용이 가능하다. 

일상의 모든 AI를 위한 최선의 조합 갖춘 인텔 코어 울트라 200V 시리즈 탑재 노트북 PC / 권용만 기자

인텔은 PC 시장의 태동에서부터 지금까지도 PC와 x86 프로세서 기반 컴퓨팅 시장에서 가장 큰 영향력을 가진 회사다. 하지만 지금까지 몇 년간 이어져 온 전 세계적인 ‘생성형 AI’에 대한 높은 관심과 올해 PC 시장 변화의 핵심 중 하나로 꼽히는 ‘AI PC’ 모두에서 시장에서 큰 주목을 받는 위치는 아니었던 모습이다. 특히 AI와 AI PC를 관통하는 ‘GPU’에 있어 인텔의 경쟁력은 지금까지 실제 역량보다도 제법 평가절하되어 오지 않았나 하는 생각이 든다. 회사 내외로 여러 악재 속에 제대로 기술 역량을 알릴 기회를 놓친 부분도 지금의 상황에 영향을 미쳤을 것이다.

하지만 인텔의 최신 ‘코어 울트라 2세대’ 제품은 이제 본격적인 전환이 시작될 것으로 기대되는 ‘AI PC’ 시장을 가장 본질적으로 파악하고 준비한 제품임에 분명하다. 인텔은 본격적으로 AI PC 시장을 연 초대 ‘코어 울트라’에서부터 PC에서의 AI 처리를 ‘CPUㆍGPUㆍNPU 모두를 활용하는’ 모델로 정의한 바 있다. 코어 울트라 2세대에서는 제품 세그먼트에 따라 GPU의 AI 역량과 NPU 역량까지 대폭 강화하며 새로운 시대를 대비했다. 인텔의 GPU 역량은 지금까지 제법 저평가됐지만, XMX가 탑재된 내장 GPU를 갖춘 코어 울트라 2세대의 AI 성능은 이제 무시할 만한 수준이 아니다.

특히 코어 울트라 2세대 제품군 중에서도 ‘코어 울트라 200V 시리즈’는 일상을 위한 AI PC로 모든 조건을 갖춘 특별한 존재가 됐다. 언제 어디서나 쓸 수 있게 얇고 가벼우면서도 하루 종일 배터리로 부담없이 사용할 수 있고, 모든 유형의 AI 작업에 대응할 수 있는 준수한 성능까지 갖췄다. 코어 울트라 200V 시리즈가 처음 선보인 지도 이제 1년 가까이 됐지만, AI PC 시대의 개막과 함께 출시 당시보다도 제품의 매력은 더 높아졌다. 지금까지 ‘AI PC’에 대해 고성능 GPU가 장착된 크고 무거운 고성능 제품만을 생각했다면 이제는 고정관념을 바꿀 때가 됐다.

권용만 기자

yongman.kwon@chosunbiz.com