“성능 50% 높였다” 클라우드 물 만난 ‘AMD 4세대 서버’
AMD가 데이터센터용 ‘에픽(EPIC)’ 프로세서의 새로운 제품을 선보이며 워크로드 최적화 구성 포트폴리오를 확장했다. 기존 에픽의 강점을 유지하면서 ‘클라우드 네이티브’ 환경과 ‘테크니컬 컴퓨팅’ 환경에서 성능과 효율을 극대화한 것이 특징이다.
AMD는 13일(현지시각) 미국 캘리포니아주 샌프란시스코에서 열린 ‘AMD 데이터 센터 & AI 테크놀로지 프리미어’ 행사에서 데이터센터용 ‘에픽’ 프로세서의 새로운 제품군을 선보였다.
AMD가 새롭게 선보인 코드명 ‘베르가모(Bergamo)’는 코어 밀도와 효율에 최적화된 ‘젠 4c(Zen 4c)’ 코어를 최대 128개 탑재했다. ‘베르가모’에 사용된 ‘젠 4c’는 기존 고성능 지향 ‘젠 4’ 대비 코어 밀도와 효율에 최적화된 디자인으로 면적을 35% 정도 줄인 것이 특징이다.
또한 고성능 컴퓨팅 등 ‘테크니컬 컴퓨팅’ 영역을 위해서는 기존 ‘제노아(Genoa)’에 3D V-캐시 기술을 적용해 1.1GB의 L3 캐시를 갖춘 ‘제노아-X’를 발표했다.
리사 수(Lisa Su) AMD CEO는 이 자리에서 "현재 AMD의 데이터센터용 프로세서 기술은 다양한 영역에서 인류가 직면한 어려운 문제들을 해결하는 데 기여하고 있다"고 밝혔다. 이어 "AMD는 다양한 유형의 워크로드에 최적화된 모던 데이터센터 환경을 위해 CPU, AI 가속기, FPGA와 어댑티브 SoC, 스마트NIC과 DPU 등 폭넓은 제품군을 갖추고 있다"고 강조했다.
4세대 에픽 ‘제노아’는 데이터센터의 다양한 워크로드를 위한 가장 균형 잡힌 구성을 제공한다. 최대 96코어 구성과 12채널 DDR5 메모리 컨트롤러, PCIe 5.0 기술 등을 지원하는 것이 특징이다. AMD는 이 ‘제노아’가 데이터센터에서 뛰어난 성능과 비용 효율 등으로 주요 클라우드 사업자들과 많은 기업들에서 도입을 결정한 바 있다고 강조했다. 이어 "최신 에픽 프로세서는 데이터센터의 현대화와 고효율화를 위한 최선의 선택이다"라고 강조했다.
데이비드 브라운(David Brown) AWS EC2 담당 부사장은 이 자리에서 "AWS는 2018년부터 AMD와의 협력을 통해 에픽 프로세서 기반 EC2 인스턴스를 제공해 왔다"고 밝히며 "새로운 4세대 에픽 프로세서 기반의 EC2 M7a 인스턴스는 기존 M6a 대비 50%까지 향상된 성능을 제공할 수 있다"고 소개했다.
이 M7a 인스턴스는 4세대 에픽의 AVX-512나 VNNI 지원 등을 통해 다양한 유형의 워크로드에서 이전 세대 대비 최대 50%까지 향상된 성능을 제공한다. 현재 프리뷰가 제공되고 있고, 3분기 중 정식 서비스가 제공될 예정이다.
‘클라우드 네이티브’ 환경은 기존의 애플리케이션 환경보다 더 작은 ‘기능’ 단위의 앱들이 필요에 따라 대량으로 구동되고 사라지는 등, 효율적이고 민첩한 모습을 보인다. AMD는 이러한 클라우드 네이티브 환경에 중요한 점으로 성능과 확장성, 컴퓨트 밀도와 에너지 효율을 꼽으며, 이러한 ‘클라우드 네이티브’ 환경에 최적화된 프로세서로 최대 128개의 ‘젠 4c’ 코어를 탑재한 4세대 에픽 97X4 ‘베르가모(Bergamo)’ 시리즈 프로세서를 공식 발표했다.
이 ‘베르가모’의 특징은 ‘코어 밀도’로, 다이당 16코어의 ‘젠 4c’ 코어가 집적된 새로운 CCD(Core Complex Die)를 최대 8개 사용해서 128코어 구성을 제공한다. 이 ‘젠 4c’ 기반 CCD는 ‘젠 4’ 아키텍처의 주요 특징이 그대로 활용되지만, 코어 집적 구성에서 한 개의 CCD에 8코어 구성의 CCX(CPU Core Complex) 두 개를 집적하고 코어당 L3 캐시 용량을 2MB 정도로 줄였으며, 코어 밀도와 에너지 효율 극대화를 위한 구성 요소 재배치 최적화 등을 통해 코어 면적을 35%까지 줄였다.
AMD는 이 새로운 ‘젠 4c’도 ‘젠 4’의 주요 특징을 공유하며 완전한 소프트웨어 호환성과 플랫폼 호환성을 제공한다고 강조했다. IOD(I/O Die)는 기존의 에픽 ‘제노아’와 공유하며, 이는 4세대 에픽 프로세서의 설계 단계부터 이미 변형 모델 구성을 염두에 두고 설계했기 때문에 가능하다고 언급했다.
AMD는 4세대 에픽 9754 기반 시스템이 4세대 인텔 제온 플래티넘 8490H 기반 시스템 대비, 더 많은 코어 수를 기반으로 클라우드 네이티브 워크로드에서 최대 2.6배 높은 처리량을 제공한다고 소개했다. 서버당 컨테이너 밀도는 최대 2.1배, 자바 환경의 전력 효율은 최대 두 배 높다고 덧붙였다. 이와 함께, 암페어(Ampere)의 128코어 프로세서 알트라 맥스(Altra Max)와 비교하면 컨테이너 밀도는 3배 높고, 자바 환경의 전력 효율은 2.7배까지 높다고 소개했다.
이 에픽 97X4 시리즈 프로세서는 이미 주요 대규모 클라우드 사업자 고객에 공급되고 있으며 메타(Meta)가 주요 서비스들에 이 프로세서 기반의 시스템을 사용해서 뛰어난 성능과 개선된 비용 효율을 달성한 것으로 알려졌다.
알렉시스 비욜린(Alexis Björlin) 메타 인프라 부문 부사장은 이 자리에서 "메타는 AMD와 함께 에픽 프로세서와 플랫폼을 하드웨어와 소프트웨어 모두에서 최적화해 밀도와 효율을 극대화했으며, 이미 수천 개의 서비스를 AMD의 시스템 위에서 운영하고 있다"고 소개했다.
제품이나 구조 디자인, 엔지니어링 시뮬레이션이나 모델링 등에서의 성능은 기업의 경쟁력을 좌우하는 중요한 부분으로 자리매김했다. 코드명 ‘제노아-X’로 알려진 ‘3D V-캐시 적용 4세대 에픽 프로세서’는 기존 에픽 9004 시리즈 ‘제노아’의 CCD에 3D V-캐시를 적용해 이러한 ‘테크니컬 컴퓨팅’ 영역의 성능을 극대화했다. 3D V-캐시로 CCD당 64MB의 캐시를 더해, 최대 96코어 구성에서 전체 L3 캐시 용량은 1GB를 넘는 1152MB에 달하며, 기존 ‘제노아’ 기반 시스템과 소켓 수준에서 호환 가능하다.
이 ‘3D V-캐시 적용 4세대 에픽 프로세서’는 96코어와 32코어, 16코어 구성 등 세 가지 종류의 제품이 선보인다. 이 중 96코어 모델인 9684X는 96코어 192스레드, 기본 2.55GHz와 최대 3.7GHz의 동작 속도, 1152MB L3 캐시를 갖췄으며 TDP는 400W다. 32코어 모델인 9384X는 32코어 64스레드, 기본 3.1GHz에 최대 3.9GHz의 동작 속도, 768MB L3 캐시를 갖췄으며, TDP는 320W다. 16코어 모델인 9184X는 16코어 32스레드, 기본 3.55GHz에 최대 4.2GHz 동작 속도와 768MB L3 캐시를 갖췄고, TDP는 320W다.
AMD는 이들 프로세서 제품군이 CFD(Computational fluid dynamics)나 FEA(Finite element analysis), EDA(Electronic design automation) 등에서 높은 성능을 제공한다고 밝혔다. 특히 96코어 구성의 에픽 9684X 프로세서 기반 시스템은 60코어 구성의 4세대 인텔 제온 8490H 대비 오픈폼(OpenFOAM)이나 앤시스(Ansys)의 CFS, LS-DYNA, 플루언트(Fluent) 등에서 평균 2~2.4배 성능을 제공한다고 밝혔다.
32코어급 제품간 비교에서도 에픽 9384X는 제온 8462Y 대비 크게는 평균 1.8배 높은 성능을 제공한다고 소개했다. 이 외에도 같은 4세대 에픽에서도 3D V-캐시 여부에 따른 성능 차이는 시놉시스 VCS에서 73%에 이른다고 덧붙였다.
이 ‘제노아-X’ 프로세서는 마이크로소프트 애저 HBv4와 HX 인스턴스에서도 활용된다. 니디 차펠(Nidhi Chappell)마이크로소프트 애저 HPC와 AI 부문 책임자는 이 자리에서 "새로운 ‘제노아-X’ 기반으로 구현된 애저 HBv4와 HX 인스턴스는 HPC 인스턴스에서 이전 대비 최대 5배의 성능 향상을 제공하며, 뛰어난 확장성을 갖췄다"고 소개했다. HX 인스턴스는 메모리 지연 시간이 아주 적은 것이 특징이라고 덧붙였다.
샌프란시스코=권용만 기자 yongman.kwon@chosunbiz.com