“앞으로 오픈소스·클로즈드·소버린 모델이 모두 공존하는 환경이 될 것입니다. 퀄컴은 특정 모델에 얽매이지 않고 모든 생태계와 협력할 계획입니다.”
비네쉬 수쿠마 퀄컴 부사장 겸 AI 제품 총괄은 25일(현지시각) 미국 하와이 하얏트 리젠시 마우이 리조트에서 열린 ‘스냅드래곤 서밋 2025’에서 한국 취재진과 만나 “국가별 역사·언어·규제 요건에 맞춰 학습된 소버린 모델은 특정 국가에서 경쟁력을 가질 수 있다”며 “퀄컴의 목표는 이런 다양한 모델이 스냅드래곤 디바이스에서 원활히 구동될 수 있도록 지원하는 것”이라고 이같이 강조했다.
수쿠마 부사장은 이어 “우리는 모델 제작자가 아니다”라며 “엣지·온디바이스 환경에서 파트너와 개발자들이 유연하게 AI를 활용할 수 있도록 플랫폼을 제공하는 것이 퀄컴의 역할”이라고 말했다.
그는 “각국의 규제 준수를 보장하기 위해 테스트 스위트를 운영하고 있으며, 이를 통해 소프트웨어 패키지를 업데이트하고 인증 리포트를 제출한다”고 설명했다.
수쿠마 부사장은 온디바이스와 클라우드 간 데이터 이동에 대해서도 구체적으로 언급했다. 사용자의 브라우징 기록·대화 내용에서 추출한 요소를 지식 그래프와 벡터 데이터베이스로 구성해 메모리 상에서 암호화 보관하고, 필요한 정보만 증강해 프롬프트에 사용한다는 것이다. 클라우드가 필요할 때는 사용자 정보 전체가 아니라 중요 메타데이터만 암호화해 전송하며, MCP 프로토콜 역시 암호화된 상태로 운영해 프라이버시를 보호한다고 설명했다.
분산 온디바이스 AI(distributed on-device AI) 사례로는 스냅드래곤 8 엘리트 5세대와 X2 엘리트 플랫폼을 언급했다. PC와 스마트폰 등 여러 기기 간 지식 그래프를 공유해 개인화된 경험을 유지할 수 있고, 기기 배터리가 꺼지더라도 다른 기기에서 동일한 맥락을 이어받아 작업을 계속할 수 있다고 말했다.
수쿠마 부사장은 7월 뉴욕에서 열린 삼성 갤럭시 테크 포럼에 참석했다. 당시 화두를 묻는 질문에 그는 "엠비언트(ambient) AI와 개인화가 핵심이었다"며 “폰·PC·웨어러블·글래스 등에서 사용자 정보를 온디바이스로 안전하게 저장하고, 온디바이스 학습·미세튜닝을 통해 개별 사용자에 적응하는 방향을 강조했다"고 말했다.
수쿠마 부사장은 "이 같은 방향성을 삼성전자도 공유하고 있으며 차세대 갤럭시 AI(웨어러블·PC·폰·글래스)는 더 개인적인 경험을 목표로 한다"고 설명했다.
웨어러블 분야에서는 스마트 글래스와 웨어러블을 연동해 글래스 촬영 시 스마트폰을 열지 않고 프리뷰를 제공하는 등 문맥적 상호작용을 강화할 수 있다고 소개했다. 헬스 데이터(걸음·심박 등)를 활용해 스트레스·휴식 권고 등 라이프스타일 개선 서비스도 가능하다고 덧붙였다.
AI 개발자 생태계에 대해서는 “AI 허브가 점점 더 많은 개발자들의 자산 활용을 이끌고 있다”며 “8 엘리트 5세대와 X2 엘리트 플랫폼도 AI 허브에 호스팅될 예정”이라고 밝혔다. 이를 통해 개발자들이 차세대 기기 출시 전에도 다양한 유스케이스를 실험하고 애플리케이션을 구축할 수 있다고 설명했다.
헥사곤 NPU 아키텍처 설계와 관련해 그는 “전력 효율성·128k 컨텍스트 지원·낮은 지연(latency)·토큰 처리 속도·새로운 데이터 타입 지원이 최우선이었다”고 말했다. 또 “트랜스포머·상태 공간 모델·전문가 혼합 모델 등 다양한 모델을 지원할 만큼 범용적이면서도 효율성이 높아야 한다”고 강조했다.
메모리 관리와 관련해 수쿠마 부사장은 “양자화를 통해 70억(7B) 파라미터 모델의 메모리 사용량을 2GB 이하로 줄일 수 있고, 어댑터는 100~200MB 정도, 벡터 데이터베이스는 12개월치가 400~500MB 수준”이라며 “민감한 벡터 데이터베이스는 RAM에만 두고 플래시에는 저장하지 않는다”고 설명했다. 이어 “플래시와 RAM을 교차 활용해 메모리 충돌을 해결한다”며 “이런 방식으로 OEM·OS와 협력해 리소스 배치를 결정한다”고 덧붙였다.
마우이(미국)=이광영 기자
gwang0e@chosunbiz.com