“에이전틱 인공지능(AI) 시대 토큰 사용량이 폭증하면서 효율성 개선이 중요해지고 있다. 현재의 폐쇄적 그래픽처리장치(GPU) 기반 시스템 구조와 연결은 지속 가능하지 않고, 다양한 하드웨어가 결합돼 효율을 최적화할 수 있는 ‘개방형 이종 결합’ 생태계가 대세가 될 것이다.”

사친 카티(Sachin Katti) 인텔 네트워크 및 엣지 그룹 총괄 부사장 겸 최고 기술 및 AI 책임자(CTAIO)는 9월 28일부터 30일까지 미국 애리조나주 피닉스에서 열린 ‘인텔 테크 투어 2025 미국’ 행사에서 인텔의 AI 인프라 전략을 소개하며 향후 방향성에 대해 이와 같이 말했다.

인텔의 ‘개방형 이종 결합’ 생태계는 다양한 하드웨어가 인텔의 개방형 소프트웨어 플랫폼을 통해 결합, 조율되는 구조로 구성된다. 인텔의 소프트웨어 플랫폼은 인텔의 하드웨어 뿐만 아니라 타사의 하드웨어도 연결 가능한 개방성과 유연성을 제공한다. 특히 인텔은 이번 행사에서 인텔의 ‘가우디 3’ 가속기와 엔비디아 ‘B200’ GPU(그래픽처리장치)를 함께 사용한 구성에서 최대 1.7배의 비용 효율 개선했다고 제시했다.

사친 카티 인텔 네트워크 및 엣지 그룹 총괄 부사장 겸 최고 기술 및 AI 책임자 / 인텔
사친 카티 인텔 네트워크 및 엣지 그룹 총괄 부사장 겸 최고 기술 및 AI 책임자 / 인텔

사친 카티 총괄부사장은 이 자리에서 “인텔은 컴퓨트 플랫폼의 원자 수준에서 랙까지, 제조부터 소프트웨어까지 모든 스택을 갖춘 특별한 위치에 있다”며 “립부 탄 CEO 이후 ‘새로운 인텔’은 경쟁력을 위해 많은 변화를 겪었다. 핵심은 ‘엔지니어링 중심’이고 엔지니어들이 중요한 변화를 결정하는 의사결정에 더 적극적으로 참가할 수 있게 됐다. 제품에도 고객의 워크로드를 중심으로 고려한다”고 말했다

인텔의 AI 전략은 ‘개방형 이종 결합 인프라’로, 결합의 폭과 깊이 모두 예전보다 더 넓어졌다. 사친 카티 총괄부사장은 “최근 발표한 엔비디아와의 파트너십은 새로운 AI 전략의 시작점”이라 소개했다. 또한 “인텔은 PC에서 클라우드까지 전체 생태계에 걸친 개방형 생태계와 AI 시스템에 대한 폭넓은 협력을 추구한다”며 “다양한 기술을 조합한 AI 시스템 구현에서는 ‘개방성’이 핵심이다. 인텔은 모든 혁신 기술을 아키텍처에 활용할 것”이라고 밝혔다.

이러한 새로운 전략의 중심에는 최근 관심이 높아진 ‘에이전틱 AI’가 있다. 향후 2028년에 이르면 AI 워크로드의 80%가 ‘추론’일 것이며, 에이전틱 AI는 기업들의 AI 투자 회수에 핵심이 될 것으로 전망된다. 에이전틱 AI가 본격화되면서 AI의 운영에 필요한 토큰 수도 폭발적으로 증가했고, 토큰 생성 비용과 성능 최적화를 위한 고민이 더 중요해졌다. 사친 카티 총괄부사장은 “앞으로 에이전틱 AI에서는 토큰 요구량이 폭발적으로 증가할 것이고, 현재의 폐쇄적인 GPU 기반 시스템 구조와 연결은 지속가능하지 않을 것”이라 지적했다.

에이전틱 AI 시대 인프라의 미래로는 다양한 하드웨어의 ‘이종 결합’ 환경이 제시됐다. / 인텔
에이전틱 AI 시대 인프라의 미래로는 다양한 하드웨어의 ‘이종 결합’ 환경이 제시됐다. / 인텔

에이전틱 AI 환경은 수많은 에이전트들과 다양한 모델, API들이 함께 조율되며 운영되는 복잡한 상황이 된다. 이러한 환경에서는 에이전트 수준에서뿐만 아니라 개별 에이전트 안에서도 각 수행 단계별로 하드웨어 특성 요구 수준들이 모두 다르다. 인텔은 이런 복잡한 상황을 최적화하는 방안으로 CPU와 다양한 GPU, 가속기 등을 조합하고 단일 소프트웨어 플랫폼에서 통합, 조율하는 ‘이종 결합’ 환경을 제시했다. 

인텔의 ‘오픈 AI 소프트웨어 스택’은 오늘날 복잡한 에이전틱 AI와 다양한 이종 하드웨어 구성 사이를 ‘연결’하고 ‘조율’하는 역할이 이전보다 더 중요하게 언급됐다. 이 소프트웨어 스택은 대규모 AI 환경을 간편하게 구축할 수 있는 ‘턴키 소프트웨어’로의 제공을 위해 다양한 에이전트와 하드웨어 간의 조율 역할이 강조된다. 이 스택의 하단에는 다양한 하드웨어를 표준화된 방법으로 연결하기 위한 ‘원API(OneAPI)’가 있고, 이를 기반으로 한 에이전틱 AI 스택이 다양한 프레임워크와 연결되는 구성이다.

인텔은 에이전틱 AI를 위한 이종 하드웨어 구성의 예시로 인텔의 ‘가우디 3’와 엔비디아의 ‘B200’을 결합해 비용 효율을 1.7배 올린 사례를 제시했다. 이는 단순히 엔비디아의 GPU를 대체하는 것이 아니라 데이터센터 내부에 두 GPU 기반 시스템을 함께 구성하고 소프트웨어 스택으로 통합해 각자 최적의 위치에서 워크로드를 처리함으로써 성능을 극대화하는 구성이다. 

에이전틱 AI 시대를 위한 인텔의 주요 계획 / 인텔
에이전틱 AI 시대를 위한 인텔의 주요 계획 / 인텔

향후 인텔의 AI 시대를 위한 실행 계획은 PC와 데이터센터 모두로 확장될 계획이다. 이 중 첫 단계는 PC에서 데이터센터까지, 프로세서와 GPU, NPU(신경망처리장치) 등을 모두 아우르는 ‘이종 인프라’ 접근과 이를 개방형 AI 소프트웨어 스택으로 결합하는 전락이다. 인텔은 추후 에이전틱 AI 시대를 위한 GPU 전략에서 메모리 용량과 대역폭 성능을 확장해 엔터프라이즈 레벨 추론 환경에 최적화한 새로운 GPU를 준비하고 있다. 

이 다음 단계에서는 다양한 실리콘과 패키징 기술이 결합된 XPU(통합처리장치) 콘셉트 제품군도 선보일 전망이다. 이는 향후 출시될 것으로 알려진 ‘재규어 쇼어(Jaguar Shore)’ 등 ‘쇼어’시리즈가 될 것으로 보이며, 8개 정도의 타일 구성과 HBM등을 EMIB(Embedded Multi-die Interconnect Bridge)와 포베로스(Foveros) 기술 등으로 결합한 형태로 보였다. 첫 세대인 ‘팔콘 쇼어(Falcon Shores)’는 결국 등장하지 않았지만, 인텔은 여전히 ‘쇼어’ 시리즈를 적절한 시기에 시장에 선보인다는 의지를 언급했다.

이러한 전략의 바탕에는 인텔의 폭넓은 AI 솔루션 포트폴리오와 개방형 생태계가 있다. 반도체 제조 공정에서도 최신 18A 공정에서 리본펫(RibbonFET)과 후면전력배선기술인 파워비아(PowerVIA), EMIB와 포베로스 등 고급 패키징 기술을 통해 다양한 제품 구성이 가능한 역량을 갖췄다고 언급했다. 사친 카티 총괄부사장은 마무리에서 “인텔은 AI 시대에 칩 디자인과 제조를 모두 갖춘 특별한 위치에 있다”고 말했다.

피닉스=권용만 기자

yongman.kwon@chosunbiz.com

관련기사