구글 클라우드, 7세대 TPU ‘아이언우드' 출시… “이전 세대 4배 성능”

2025-11-07 권용만 기자

구글 클라우드는 6일(현지시각) 7세대 TPU(Tensor Processing Unit)인 ‘아이언우드(Ironwood)’를 정식 출시한다고 발표했다. 대규모 모델 학습과 대용량 저지연 추론 등 까다로운 AI 워크로드의 처리를 위해 설계된 아이언우드는 이전 ‘트릴리움(v6e)’ 대비 4배 향상된 성능을 제공한다.

구글 클라우드 7세대 TPU '아이언우드' / 구글 클라우드

구글 클라우드는 ‘아이언우드’를 지난 4월 구글 클라우드 넥스트 2025(Next 2025) 행사에서 프리뷰 버전으로 공개한 바 있다. 아이언우드는 대규모 모델 학습, 복잡한 강화학습(RL), 대용량·저지연 AI 추론 등 가장 까다로운 AI 워크로드를 처리하도록 특별히 설계됐다. 기존 TPU v5p 대비 최대 10배 향상된 성능과 트릴리움(TPU v6e) 대비 칩당 최대 4배 향상된 학습 및 추론 작업 성능을 제공한다.

아이언우드는 최대 9216개의 칩으로 구성된 슈퍼포드(superpod)로 확장할 수 있으며, 초고속 인터칩 인터커넥트(ICI) 네트워킹 기술로 연결돼 9.6Tb/s의 속도를 구현한다. 이를 통해 1.77 페타바이트(PB)의 공유 고대역폭 메모리(HBM)를 활용해 복잡한 AI 모델에서 발생하는 데이터 병목 현상을 최소화한다.

이와 함께 아이언우드는 광회로 스위칭(OCS: Optical Circuit Switching) 기술을 활용해 네트워크 장애가 발생해도 실시간으로 경로를 재구성해 서비스 중단 없이 워크로드를 복구할 수 있다. 성능 향상이 필요한 경우에는 수십만 개의 TPU를 클러스터로 확장할 수 있다.

한편, 아이언우드는 구글 클라우드의 통합 AI 슈퍼컴퓨팅 시스템 ‘AI 하이퍼컴퓨터(Hypercomputer)’의 핵심 구성 요소로도 사용된다. 앤트로픽은 아이언우드를 대규모 클로드(Claude) 모델 학습과 수백만 명의 사용자에게 서비스를 제공하기 위한 환경으로 사용할 계획으로 알려졌다.

구글 클라우드는 일상 워크로드에 뛰어난 성능과 효율성을 갖춘 맞춤형 CPU ‘액시온(Axion)’ 제품군의 확장도 발표했다. Arm 네오버스(Neoverse) 기반으로 구현된 ‘액시온’은 구글 클라우드의 N4A, C4A, C4A 메탈(C4A metal) 등 세 가지 서비스에서 제공돼 고객이 원하는 성능과 워크로드별 요구사항에 부응하면서도 비즈니스 운영의 총 비용을 낮출 수 있도록 돕는다.

프리뷰 버전으로 공개된 N4A는 마이크로서비스, 컨테이너화된 애플리케이션, 오픈소스 데이터베이스, 데이터 분석 및 웹 서비스 작업 등에 이상적이며, 현 세대 동급 x86 기반 VM 대비 최대 2배 우수한 가격 대비 성능과 80% 높은 에너지 효율을 제공한다. ‘C4A 메탈’은 전용 물리 서버가 할당되는 베어메탈 형으로, 안드로이드 개발이나 차량 내 시스템, 엄격한 라이선스가 필요한 소프트웨어 등 전문화된 워크로드를 지원한다.

마크 로메이어(Mark Lohmeyer) 구글 클라우드 AI 및 컴퓨팅 인프라 부문 부사장 겸 총괄 매니저는 “구글 클라우드는 오늘날 추론의 시대를 10년 전 처음 선보인 TPU를 비롯해 이미 오래 전부터 대비해 왔다”며 “구글 클라우드 고객은 하드웨어부터 소프트웨어, 관리형 서비스까지 긴밀히 통합된 풀 스택 AI 하이퍼컴퓨터를 바탕으로, 아이언우드와 액시온을 비롯한 다양한 컴퓨팅 옵션을 조합해 가장 까다로운 워크로드에도 최적의 유연성과 성능을 확보할 수 있을 것”이라고 말했다.

권용만 기자

yongman.kwon@chosunbiz.com