AMD가 더 효율적인 비디오 스트리밍 인프라 구현을 위한 ‘알베오(Alveo) MA35D’ 미디어 가속기 카드를 선보였다. ‘알베오 MA35D’ 가속기는 채널당 비용은 이전 세대 대비 절반으로 줄인 ‘50달러’를, 전력소비랑은 채널당 1와트(W)를 달성해 대규모 비디오 스트림 수요를 효율적으로 제공할 수 있다.

AMD는 6일(미국시각 기준) 알베오 MA35D 미디어 가속기 제품을 발표했다. 5나노미터(nm) ASIC 기반의 ‘알베오 MA35D’는 이전 세대 대비 4배 증가한 채널 밀도, 최대 2배 낮은 채널당 비용, 최대 1.8배 향상된 압축 성능, 최대 4배 짧은 지연 시간 등의 특징을 제공한다.

알베오 MA35D는 카드당 최대 32개의 1080p60 H.26x나 AV1 영상이나 8개의 4Kp60, 4개의 8Kp30 영상을 스트리밍할 수 있다. 코덱은 H.264나 H.265 뿐 아니라 최신 AV1을 지원해, 비디오 스트리밍에서 대역폭 활용 효율을 높일 수 있으며, 인공지능 기반 최적화 기술로 대역폭 대비 품질을 극대화한다. 카드당 소비전력은 35W로, 1U 서버에 카드 8장을 장착해 1U 서버당 256 스트림을 소화할 수 있는 고밀도 구성도 가능하다.

AMD 알베오 MA35D 미디어 가속기 / AMD
AMD 알베오 MA35D 미디어 가속기 / AMD
그리쉬 말리페디(Girish Malipeddi) AMD AECG 그룹 제품 관리 및 마케팅 디렉터는 이번 ‘알베오 MA35D’에 대해 "대규모의 양방향 스트리밍 서비스를 위한 효율적인 인프라를 구현할 수 있게 한다"고 말했다. 또한 "알베오 MA35D는 5nm ASIC 기반으로 구현되어 높은 수준의 성능, 전력 효율, 채널 밀도를 달성했으며, 현재 시장에서 요구되는 효율적인 저지연 라이브스트림 요구에 효과적으로 대응할 수 있다"고 밝혔다.

현재 글로벌 비디오 스트리밍 시장은 2028년까지 연 평균 20%의 높은 성장이 기대된다. 2021년 기준, 글로벌 비디오 스트리밍 시장에서 ‘라이브 스트리밍’의 비중은 70%에 이르는 것으로 추산된다. 하지만 전통적인 방송 스트리밍 모델은 소수의 스트림을 데이터센터를 거쳐 다수의 사용자에 배포하는 구조였으며, 지연 시간에 대한 요구사항 또한 그리 까다롭지 않았다.

하지만 화상 협업이나 원격 의료, 원격 교육, 클라우드 게이밍이나 온라인 베팅 등의 ‘양방향 라이브 스트리밍’은 지연시간에 민감하며, 기존의 전통적인 인프라로 대응하기에 효율성이 떨어진다. 이 때 지연시간을 줄이기 위해서는 사용자에 가까운 ‘엣지 데이터센터’를 사용하는 것이 효과적인데, 사용자 가까이에 대량의 인프라가 배치되는 데는 설치를 위한 물리적 위치와 공간의 문제가 크다고 지적했다. 이에, 엣지에서 대량의 라이브 스트리밍 서비스 수요를 처리하기 위해서는 공간과 전력 밀도를 극대화하는 것이 필요하다고 강조했다.

알베오 MA35D 비디오 프로세싱 유닛 주요 구성 요소 / AMD
알베오 MA35D 비디오 프로세싱 유닛 주요 구성 요소 / AMD
‘알베오 MA35D 미디어 가속기’는 작고 효율적인, 호환성 높은 폼팩터에서 저지연 비디오 스트리밍 서비스 수요를 효율적으로 처리할 수 있는 것이 특징이다. 5nm 공정으로 구현된 ASIC이 카드당 두 개씩 탑재되어, 1080p60 영상 기준 카드당 최대 32개 채널을 처리할 수 있다. 카드당 전력 소비량은 35W로, 32개 스트림을 송출할 때 채널당 소비전력은 1W 수준이다. 지원 코덱은 H.264, H.265와 AV1을 지원하며, 지원 가능한 규격은 최대 8Kp30이다.

이전 세대 모델인 ‘알베오 U30’과 비교하면 성능 면에서 크게 향상됐다. 채널 밀도는 최대 4배 올랐으며, 압축 성능은 새로운 코덱 지원 등과 함께 최대 1.8배 향상됐다. 채널당 비용은 최대 절반 수준까지 낮아졌으며, 지연시간은 최대 네 배까지 줄어들었다. AMD 측은 이러한 특징이 서비스 제공자에 뛰어난 채널당 비용과 면적, 전력 효율을 제공해 데이터센터의 설비 투자와 운영비 절감을 제공할 수 있다고 소개했다.

‘알베오 MA35D’에 사용되는 ASIC은 칩당 네 개의 인코더를 갖추고 있다. 이 인코더 중 두 개는 AV1과 H.264, H.265를 모두 지원하고, 두 개는 AV1만 지원하는 것으로 알려졌다. 이에 1080p60 스트림 기준 H.264나 H.265만 사용하는 경우는 최대 스트림 수가 16개 정도고, AV1을 사용할 경우에는 32개 스트림 처리가 가능하다. 또한 인터렉티브 스트리밍 서비스 수요를 지원하기 위해 디코더를 갖추고 있는데, AV1, H.264, H.265와 VP9 규격을 지원한다.

알베오 MA35D는 사용자의 환경에 따라 영상 품질을 조정하는 적응형 비트레이트 스케일러, 다중 화면과 다중 레이어링을 지원하는 컴포지터 엔진을 하드웨어 방식으로 갖추고 있다. 또한 칩에 AI 연산 가능한 프로세서가 탑재되어, 이를 기반으로 콘텐츠의 ROI(Region-of-interest) 인코딩을 통한 품질 최적화를 지원한다. 이 AI 프로세서는 영상에서 인물의 얼굴이나 텍스트, 빠른 움직임 등 중요한 부분에 품질을 집중함으로써 체감 품질을 효율적으로 높일 수 있게 한다.

높은 압축률의 AV1 코덱을 성능 부담 없이 활용할 수 있다 / AMD
높은 압축률의 AV1 코덱을 성능 부담 없이 활용할 수 있다 / AMD
AMD는 알베오 MA35D 미디어 가속기가 비디오 처리의 파이프라인 전반을 하드웨어 형태로 구현해 호스트와 데이터 전송을 최소화하고, 짧은 지연시간으로 채널 밀도를 극대화했다고 강조했다. 또한 AI를 활용해 ROI 최적화를 실시간으로 적용할 수 있으며, 소프트웨어 기반에서는 같은 효과에 20프레임 정도의 지연이 필요했지만 하드웨어 방식에서는 1프레임 정도의 영향에 그친다고 밝혔다.

품질을 유지하면서 네트워크 전송 비용을 줄이기 위한 핵심 기술은 높은 압축률을 제공하는 최신 코덱이다. 소프트웨어로 구현하는 x264 대비, 하드웨어로 구현한 H.265 코덱은 동등한 수준의 품질에서 비트레이트를 47%까지, AV1 코덱은 52%까지 줄일 수 있다. 이러한 압축률을 소프트웨어로 구현하는 것보다는 지연시간과 처리 스트림 수 등에서 큰 차이를 보인다.

이 카드는 PCIe HHHL(Half Height Half Length) 폼팩터로 범용 서버들과 높은 호환성을 제공한다. 이 카드를 1U급 범용 서버에 최대 8개까지 장착하면, 서버당 256개 채널을 처리할 수 있는 고밀도 시스템을 최소한의 부피와 소비전력으로 구현할 수 있어, 채널당 비용과 면적, 전력 소비량을 모두 최소화할 수 있다. AMD는 이 때 채널당 비용은 이전 세대 대비 절반 수준인 50달러, 채널당 전력소비량은 1W 수준이며, 채널당 사용하는 대역폭은 소프트웨어 구현 대비 최대 52%까지 줄일 수 있다고 제시했다.

알베오 MA35D 미디어 가속기는 자일링스의 비디오 SDK 런타임 라이브러리 기반에서, 보편적으로 사용되는 FFmpeg, GStreamer나 미디어 가속기 API를 통해 활용할 수 있다.

AMD는 CPU, GPU, 미디어 가속기로 이어지는 데이터센터용 미디어 포트폴리오에서 CPU는 품질과 대역폭이 필요하고 저지연 요구가 낮을 때 적합하며, 스트리밍 밀도가 높아지고 초저지연 환경이 필요할 때는 알베오 MA35D 미디어 가속기를 함께 사용하는 것을 추천했다.

한편, 이 제품은 현재 샘플 공급 중이며, 2023년 3분기 생산 예정이다.

권용만 기자 yongman.kwon@chosunbiz.com