엔비디아가 기업이 대량의 데이터를 분석해 빠르게 비즈니스 예측을 수행할 수 있는 데이터 사이언스 및 머신 러닝용 ‘래피즈(RAPIDS) GPU 가속 플랫폼’을 공개했다.

엔비디아 래피즈 로고. / 엔비디아 제공
엔비디아 래피즈 로고. / 엔비디아 제공
엔비디아 엔지니어들이 2년에 걸쳐 오픈소스에 기여하는 핵심 관계자들과 긴밀히 협업해 개발한 래피즈는 데이터 과학자들이 신용카드 사기 예측, 소매 재고 예측, 고객의 구매 행동 파악 등 매우 복잡한 비즈니스 과제를 해결할 수 있는 강력한 처리 성능을 제공한다고 회사 측은 설명했다.

GPU 가속 분석, 머신 러닝 외에 곧 추가될 데이터 시각화를 위한 오픈소스 라이브러리를 제공하는 래피즈 플랫폼은 과학자들이 GPU에서 전체 데이터 사이언스 파이프라인을 실행하는데 필요한 도구를 제공한다.

엔비디아 DGX-2 시스템 교육을 위한 XG부스트(XGBoost) 머신 러닝 알고리즘을 사용하는 래피즈는 기존 시스템 대비 최대 50배 빠른 속도를 낼 수 있어 데이터 과학자들은 데이터 세트 크기에 따라 머신러닝 학습 시간을 기존 며칠에서 몇 시간으로, 몇 시간에서 몇 분으로 단축할 수 있다.

래피즈는 널리 사용되는 파이선(Python) 데이터 사이언스 툴체인에 GPU 가속을 추가함으로써 아파치 애로우(Apache Arrow), 팬더스(Pandas), 사이킷-런(scikit-learn)과 같은 주요 오픈소스 프로젝트를 기반으로 구축됐다. 특히 래피즈 플랫폼의 채택 범위를 확대하기 위해 분석 및 데이터 사이언스를 위한 오픈소스 프레임워크 아파치 스파크(Apache Spark)와 통합 중이다.

엔비디아는 래피즈에 추가적인 기능과 머신 러닝 라이브러리를 제공하기 위해 오픈소스 생태계에 기여하는 아나콘다, 블래이징DB, 데이터브릭스, 콴사이트, 사이킷-런 등 커뮤니티는 물론, 우르사 랩의 대표 겸 팬더스 및 아파치 애로우 창시자인 웨스 매키니(Wes McKinney)와 같은 전문가, 데이터 사이언스 라이브러리인 파이선 등과 협력하고 있다. HPE, IBM, 오라클 등 핵심 ICT 선도기업들도 래피즈 플랫폼을 지원한다.

젠슨 황(Jensen Huang) 엔비디아 창립자 겸 CEO는 10월 9일(현지시각) 독일에서 열린 ‘GTC(GPU Technology Conference) 유럽 2018’ 기조연설에서 "고성능 컴퓨팅 시장에서 아직 가속화되지 않은 가장 큰 분야가 바로 데이터 분석과 머신러닝이다"라며 "래피즈 GPU 가속 플랫폼은 쿠다(CUDA) 기반 글로벌 생태계를 바탕으로 구축됐으며, 오픈소스 커뮤니티와의 긴밀한 협력하에 탄생했다. 엔비디아는 딥 러닝에 구현했던 것과 마찬가지로 머신 러닝 속도를 대거 끌어올리고 있다"고 말했다.

한편, 래피즈 오픈소스 라이브러리는 홈페이지(www.rapids.ai)에서 바로 접근할 수 있으며, 코드는 아파치 라이선스를 통해 배포된다. 래피즈 컨테이너 버전은 엔비디아 GPU 클라우드 컨테이너 레지스트리에서 이용할 수 있다.