AMD가 더 효율적인 비디오 스트리밍 인프라 구현을 위한 ‘알베오(Alveo) MA35D’ 미디어 가속기 카드를 선보였다. ‘알베오 MA35D’ 가속기는 채널당 비용은 이전 세대 대비 절반으로 줄인 ‘50달러’를, 전력소비랑은 채널당 1와트(W)를 달성해 대규모 비디오 스트림 수요를 효율적으로 제공할 수 있다.
AMD는 6일(미국시각 기준) 알베오 MA35D 미디어 가속기 제품을 발표했다. 5나노미터(nm) ASIC 기반의 ‘알베오 MA35D’는 이전 세대 대비 4배 증가한 채널 밀도, 최대 2배 낮은 채널당 비용, 최대 1.8배 향상된 압축 성능, 최대 4배 짧은 지연 시간 등의 특징을 제공한다.
알베오 MA35D는 카드당 최대 32개의 1080p60 H.26x나 AV1 영상이나 8개의 4Kp60, 4개의 8Kp30 영상을 스트리밍할 수 있다. 코덱은 H.264나 H.265 뿐 아니라 최신 AV1을 지원해, 비디오 스트리밍에서 대역폭 활용 효율을 높일 수 있으며, 인공지능 기반 최적화 기술로 대역폭 대비 품질을 극대화한다. 카드당 소비전력은 35W로, 1U 서버에 카드 8장을 장착해 1U 서버당 256 스트림을 소화할 수 있는 고밀도 구성도 가능하다.
현재 글로벌 비디오 스트리밍 시장은 2028년까지 연 평균 20%의 높은 성장이 기대된다. 2021년 기준, 글로벌 비디오 스트리밍 시장에서 ‘라이브 스트리밍’의 비중은 70%에 이르는 것으로 추산된다. 하지만 전통적인 방송 스트리밍 모델은 소수의 스트림을 데이터센터를 거쳐 다수의 사용자에 배포하는 구조였으며, 지연 시간에 대한 요구사항 또한 그리 까다롭지 않았다.
하지만 화상 협업이나 원격 의료, 원격 교육, 클라우드 게이밍이나 온라인 베팅 등의 ‘양방향 라이브 스트리밍’은 지연시간에 민감하며, 기존의 전통적인 인프라로 대응하기에 효율성이 떨어진다. 이 때 지연시간을 줄이기 위해서는 사용자에 가까운 ‘엣지 데이터센터’를 사용하는 것이 효과적인데, 사용자 가까이에 대량의 인프라가 배치되는 데는 설치를 위한 물리적 위치와 공간의 문제가 크다고 지적했다. 이에, 엣지에서 대량의 라이브 스트리밍 서비스 수요를 처리하기 위해서는 공간과 전력 밀도를 극대화하는 것이 필요하다고 강조했다.
이전 세대 모델인 ‘알베오 U30’과 비교하면 성능 면에서 크게 향상됐다. 채널 밀도는 최대 4배 올랐으며, 압축 성능은 새로운 코덱 지원 등과 함께 최대 1.8배 향상됐다. 채널당 비용은 최대 절반 수준까지 낮아졌으며, 지연시간은 최대 네 배까지 줄어들었다. AMD 측은 이러한 특징이 서비스 제공자에 뛰어난 채널당 비용과 면적, 전력 효율을 제공해 데이터센터의 설비 투자와 운영비 절감을 제공할 수 있다고 소개했다.
‘알베오 MA35D’에 사용되는 ASIC은 칩당 네 개의 인코더를 갖추고 있다. 이 인코더 중 두 개는 AV1과 H.264, H.265를 모두 지원하고, 두 개는 AV1만 지원하는 것으로 알려졌다. 이에 1080p60 스트림 기준 H.264나 H.265만 사용하는 경우는 최대 스트림 수가 16개 정도고, AV1을 사용할 경우에는 32개 스트림 처리가 가능하다. 또한 인터렉티브 스트리밍 서비스 수요를 지원하기 위해 디코더를 갖추고 있는데, AV1, H.264, H.265와 VP9 규격을 지원한다.
알베오 MA35D는 사용자의 환경에 따라 영상 품질을 조정하는 적응형 비트레이트 스케일러, 다중 화면과 다중 레이어링을 지원하는 컴포지터 엔진을 하드웨어 방식으로 갖추고 있다. 또한 칩에 AI 연산 가능한 프로세서가 탑재되어, 이를 기반으로 콘텐츠의 ROI(Region-of-interest) 인코딩을 통한 품질 최적화를 지원한다. 이 AI 프로세서는 영상에서 인물의 얼굴이나 텍스트, 빠른 움직임 등 중요한 부분에 품질을 집중함으로써 체감 품질을 효율적으로 높일 수 있게 한다.
품질을 유지하면서 네트워크 전송 비용을 줄이기 위한 핵심 기술은 높은 압축률을 제공하는 최신 코덱이다. 소프트웨어로 구현하는 x264 대비, 하드웨어로 구현한 H.265 코덱은 동등한 수준의 품질에서 비트레이트를 47%까지, AV1 코덱은 52%까지 줄일 수 있다. 이러한 압축률을 소프트웨어로 구현하는 것보다는 지연시간과 처리 스트림 수 등에서 큰 차이를 보인다.
이 카드는 PCIe HHHL(Half Height Half Length) 폼팩터로 범용 서버들과 높은 호환성을 제공한다. 이 카드를 1U급 범용 서버에 최대 8개까지 장착하면, 서버당 256개 채널을 처리할 수 있는 고밀도 시스템을 최소한의 부피와 소비전력으로 구현할 수 있어, 채널당 비용과 면적, 전력 소비량을 모두 최소화할 수 있다. AMD는 이 때 채널당 비용은 이전 세대 대비 절반 수준인 50달러, 채널당 전력소비량은 1W 수준이며, 채널당 사용하는 대역폭은 소프트웨어 구현 대비 최대 52%까지 줄일 수 있다고 제시했다.
알베오 MA35D 미디어 가속기는 자일링스의 비디오 SDK 런타임 라이브러리 기반에서, 보편적으로 사용되는 FFmpeg, GStreamer나 미디어 가속기 API를 통해 활용할 수 있다.
AMD는 CPU, GPU, 미디어 가속기로 이어지는 데이터센터용 미디어 포트폴리오에서 CPU는 품질과 대역폭이 필요하고 저지연 요구가 낮을 때 적합하며, 스트리밍 밀도가 높아지고 초저지연 환경이 필요할 때는 알베오 MA35D 미디어 가속기를 함께 사용하는 것을 추천했다.
한편, 이 제품은 현재 샘플 공급 중이며, 2023년 3분기 생산 예정이다.
권용만 기자 yongman.kwon@chosunbiz.com