9월 29일부터 2주에 걸쳐 인공지능에 특화된 하드웨어의 새로운 정보를 듣고 의견을 교환하는 ‘인공지능 하드웨어 서밋(AI Hardware Summit)’ 행사가 온라인으로 개최됐다. 59명의 연사와 650여명의 인사가 참석한 행사에서 흥미 있는 내용을 골라봤다.

마이클 아조프 키아스코 리서치(Kiasco Research) 수석분석가는 AI 전용 가속기를 비교분석한 결과를 발표했다. 그는 AI전용 가속기 관련 기업을 엔비디아(Nvidia)와 같이 AI 가속기를 개발해 판매하는 A유형과 구글처럼 가속기를 개발해 자체서비스에 접목하는 B 유형으로 분류했다. 또 성숙도에 따라 스타트업 또는 안정권 기업으로 나눴다.

 AI 칩 시장현황: 현재 114개의 AI 가속기 관련기업이 있으며, 80개의 스타트업에 벤처캐피털이 투자한 총 자금은 104억달러(약 12조원)이다 / 키아스코리서치
AI 칩 시장현황: 현재 114개의 AI 가속기 관련기업이 있으며, 80개의 스타트업에 벤처캐피털이 투자한 총 자금은 104억달러(약 12조원)이다 / 키아스코리서치
세계적으로 A유형 기업은 94개다. B유형은 20개로 총 114개가 존재한다. 성숙도로 분류하면 스타트업이 80개, 안정권 기업이 34개다. 스타트업에 벤처캐피털이 투자한 총자금은 104억달러(약 12조원)에 달한다. 이 중 중국기업에 투자된 금액은 72억달러(약 8조2000억원)로 압도적이다. 기업수에서도 중국은 총 29개로 미국의 51개에 이어 세계 2위를 차지했다.

마이클 아조프 수석분석가는 또 AI 칩 형태에 따라 CPU(예: 인텔 제온), GPU(예: 엔비디아, 테슬라), FPGA(예: 자일링스, 버텍스), DSA(예: 세레브라스, WSE), SOC 등 5가지 유형으로 분류했다. 활용되는 장소에 따라 데이터센터, 에지(edge), 자동차 용으로 구분했다.

 AI칩 비교: 데이터센터 사용을 목적으로 만든 AI칩을 ‘기술의 우수성’과 ‘전략수행의 우수성’ 축으로 분류했다. / 키아스코리서치
AI칩 비교: 데이터센터 사용을 목적으로 만든 AI칩을 ‘기술의 우수성’과 ‘전략수행의 우수성’ 축으로 분류했다. / 키아스코리서치
그는 또 참여한 16개 기업을 대상으로 성능, 전력소모, 소프트웨어, 보안, 비용 등을 비교 분석했다. 이를 종합해 ‘기술의 우수성’과 ‘전략수행의 우수성’ 등 두 축으로 현재의 대세 엔비디아부터 신생기업 라이트온(LightOn)까지 한눈에 비교할 수 있는 도표를 만들었다.

데이비드 패터슨 구글 석학 엔지니어(distinguished engineer)는 알파고에 사용돼 우리에게 잘 알려진 TPU(tensor processing unit)를 설명했다. TPUv1은 기존 제품에 비해 10배의 성능 향상을 목표로 2014년 개발을 시작해 2016년 서비스에 적용됐다. 그 성공은 AI 전용칩 유행에 중요한 계기가 됐다.

인공지능이 활발하게 적용되면서 계산수요가 폭증하고 있다. 예를 들어 딥러닝을 이용해 자연스러운 문장을 만들어내는 GPT-3(Generative Pre-trained Transformer 3) 성공에는 계산능력이 주요하다. GPT-3는 GPT-2에 비해서 무려 100배가 넘는 1750억개의 변수를 활용한다.

이러한 수요에 대응하기 위해 구글은 자체개발한 내부연결망을 사용한 TPUv2가 개발했다. 그 성능을 2.7배 개선한 TPUv3가 현재 서비스에 사용된다.

지아드 아스가르 퀄컴(Qualcomm) 제품관리 부사장은 5세대 AI 칩을 설명했다. 그 핵심은 4세대에 비해 성능이 2배 개선된 아드레노(Adreno) 650 GPU와 새로 개발된 헥사곤(Hexagon) 698 텐서프로세서(tensor processor)다.

퀄컴은 모바일용으로 기존 스냅드래곤(Snapdragon) 855에 비해 성능이 2배 개선된 스냅드래곤 865+ 제품을 출시했다. 데이터센터 및 에지용으로는 추론(inference)에 특화된 클라우드(Cloud) AI 100 제품을 신규 개발했다. 그 성능과 전력효율성 모두 기존 제품보다 우수하다. 특히 전력효율성에서는 경쟁제품인 엔비디아 T4 GPU에 비해 10배 이상 탁월하다.

앤드류 펠드만 세레브라스 시스템즈 CEO는 세계에서 가장 커다란 칩인 WSE(wafer scale engine)를 기반으로 한 CS-1 시스템을 설명했다. WSE는 1조2000억개의 트랜지스터로 이뤄졌다. 엔비디아 A100 GPU에 비해 칩 크기로는 56배, 코어 수는 55배, 메모리는 450배에 달하는 그야말로 ‘몬스터칩’이다.

이 행사는 이외에도 삼바노바 카디날(Cardinal), 그로크(Groq)의 TSP(tensor streaming processor), 플렉스로직 인터(Infer)X, 마이틱(Mythic) 아날로그 AI 칩, 마벨(Marvell), 알리바바, 아마존, 테슬라 등에 특화된 ASIC 칩에 대한 소개가 있었다.

※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

이지수 소장은 미국 보스턴대학에서 물리학 박사를 했고 독일 국립슈퍼컴센터 연구원, 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅센터 센터장, 사단법인 한국계산과학공학회 부회장, 저널오브컴퓨테이셔널사이언스(Journal of Computational Science) 편집위원, KISTI 국가슈퍼컴퓨팅연구소 소장을 거쳐 현재는 사우디 킹 압둘라 과학기술대학교(KAUST) 슈퍼컴센터장을 맡고 있습니다.

관련기사