기업 경쟁력 향상을 위한 'AI' 구현에 필요한 것은?

인공지능(AI) 기술의 도입은 오늘날 기업 경쟁력 향상을 위한 가장 새롭고 효율적인 수단으로 주목받고 있다. 그러나 무작정 AI를 도입하는 것보다 어떤 분야에 어떻게 적용해 그 효과를 극대화할 것인지를 간과해서는 안될 일이다.

최근 AI를 구현하기 위해 가장 많이 활용되는 기술은 딥러닝(Deep Learning) 방식이다. 인간의 신경망을 모방한 딥러닝 기술은 기존의 경험적 데이터를 기반으로 학습하는 머신러닝(Machine Learning) 방식과 달리, 데이터만 입력하면 스스로 해당 데이터의 특징과 규칙, 유효한 통계 정보 등을 찾아내고 자동으로 분류할 수 있는 것이 장점이다.

다만 딥러닝 기반 AI를 제대로 학습시키고 더욱 정확하며 다양한 기능을 부여하려면 그만큼 방대한 데이터와 더불어 그러한 데이터를 빠르게 처리할 수 있는 고성능 고용량 시스템 인프라가 필요하다.

우선, 딥러닝 학습을 위한 복잡한 연산에는 수많은 연산 유닛을 탑재해 병렬 연산에 유리한 고성능 GPU가 필요하다. 복수의 GPU를 통해 단위 시간당 연산 성능을 극대화함으로써 학습에 걸리는 시간을 단축할 수 있다. 자율주행과 슈퍼컴퓨터 등의 분야에서도 GPU를 사용하는 것도 비슷한 이유다.

물론 딥러닝 기반 AI 개발은 GPU만 좋다고 모두 해결되는 것은 아니다. 같은 시간에 더 많은 복잡한 연산과 학습을 반복하려면 방대한 데이터를 빠르게 주고받을 수 있는 고성능 대용량 스토리지도 필요하다.

특히 AI 개발을 위한 스토리지는 필요에 따라 용량과 규모를 자유롭게 조절할 수 있고 필요에 따라 자유롭게 리소스를 할당할 수 있는 ‘스케일아웃(Scale-Out)’ 아키텍처가 필수다. 딥러닝 기반 AI의 개발에는 보통 수백 테라바이트(TB)에서 수십 페타바이트(PB)의 막대한 데이터가 필요하다. 그렇기 때문에 파일의 개수와 용량의 제한이 없어야 하고 다수의 스토리지를 하나의 볼륨으로 관리할 수 있어야 한다.

더욱 정확하고 똑똑한 AI를 만들기 위해서는 비슷한 종류의 데이터만으로는 한계가 있다. 영상과 이미지, 텍스트 등 종류와 용량, 구조, 크기가 서로 다른 데이터들이 모인 ‘비정형 데이터’를 포괄적으로 다룰 수 있어야 한다. 그 때문에 스토리지의 플랫폼의 형태도 정형화되고 단순한 데이터를 다루는데 최적화된 블록 기반 스토리지가 아니라 비정형 데이터의 처리에 특화된 스토리지가 요구된다.

비정형 데이터 처리에 특화된 델 EMC 아이실론 F810. / 델 EMC 제공

딥러닝 기반 AI에 대한 수요가 높아지면서 엔터프라이즈 스토리지 솔루션 기업들도 이에 최적화된 비정형 데이터 스토리지 플랫폼을 다양하게 선보이고 있다. 델 EMC의 비정형 데이터 플랫폼 ‘아이실론(Isilon)’도 그중 하나다.

델 EMC의 아이실론은 스케일아웃 방식을 통해 단일 볼륨으로 최대 93PB까지 용량을 자유롭게 확장할 수 있으며, 시스템 중단 없이 실시간으로 용량을 확장하거나 축소할 수 있다. 특히 업무의 내용에 따라 NFS, SMB, HDFS, Swift, FTP 등의 프로토콜을 모두 지원해 유연한 대응과 활용이 가능하다. 특히 다수의 스토리지를 하나의 볼륨으로 간편하게 관리할 수 있어 운영을 간소화, 유지 관리에 들어가는 비용을 최적화할 수 있다.

가장 최신 모델인 ‘아이실론 F810’의 경우 4U 크기의 섀시에 최대 2.2PB의 유효 용량(effective capacity)을 제공하며, 최대 25만 IOPS(초당 입출력 횟수)와 15GB/s의 대역폭을 지원해 각종 비정형 데이터를 고속으로 처리할 수 있다.

144개의 노드로 구성된 하나의 클러스터를 기준으로 최대 유효 용량을 79.6PB까지 확장할 수 있으며, 입출력 성능은 최대 900만 IOPS, 스루풋(throughput, 단위 시간당 데이터 전송량)도 최대 540GB/s까지 높일 수 있다.

각종 데이터중복 제거 기술과 최대 3:1의 높은 데이터 압축률을 바탕으로 스토리지 플랫폼의 물리적인 실제 용적보다 더 많은 데이터를 다루고 처리할 수 있다. 그 때문에 같은 면적의 데이터센터 기준으로 데이터 집적도를 더욱 쉽게 높일 수 있고, 같은 용량 기준으로 소비전력과 용적을 줄이고 유지 비용 절감에 유리하다.

델 EMC는 기업들이 효율적인 AI를 더욱 쉽고 빠르게 도입할 수 있도록 아이실론에 기반을 둔 통합 AI 인프라도 제공한다. 그 중 ‘엔비디아 딥러닝 레디 번들(Deep Learning Ready Bundle with NVIDIA)’은 델 EMC의 최신 ‘파워엣지(PowerEdge)’ 서버와 아이실론 스토리지, 엔비디아의 cuDNN(CUDA Deep Neural Network Library) 등의 구성에 사전 검증까지 마친 시스템으로, 기업들이 ▲이상거래탐지 ▲금융 투자 분석 ▲안면인식 보안 ▲종양 진단 등 다양한 산업 분야에 딥러닝 기반 AI를 빠르게 도입하고 비즈니스에 활용할 수 있도록 돕는다.

특히 엔비디아의 GPU 특화 서버인 DGX와 델 EMC의 아이실론을 결합한 통합 시스템의 경우 고속 NV링크(NVLink) 인터페이스와 100Gbps~40Gbps를 지원하는 네트워크, 올플래시 기반 ‘아이실론 F800’ 스토리지를 탑재해 최대 25만 IOPS의 데이터 입출력과 15GB/s의 대역폭, 최대 924TB의 용량을 제공한다.

델 EMC의 아이실론 기반 AI 및 딥러닝 솔루션 포트폴리오. / 델 EMC 제공

이러한 델 EMC의 아이실론 플랫폼은 실제 각 분야를 대표하는 글로벌 기업 등, 다양한 기업 및 기관의 AI 구축에 활용되고 있다. 자동차 전문기업 볼보(Volvo)와 에어백 전문기업 오토리브(Autoliv)의 합작기업 제뉴이티(Zenuity)가 개발하는 자율주행 기술 및 미래 차량 플랫폼의 연구개발 사례가 대표적이다.

제뉴이티는 델 EMC의 아이실론 플랫폼에 기반한 AI를 통해 유지관리 비용을 최소화하면서 매월 약 4.4PB에 달하는 데이터 처리를 통해 차세대(Advanced Driver Assistance Systems, 이하 ADAS) 개발에 나서고 있다. 두 자릿수 PB급의 데이터를 캡처 및 분석하고, 저장 및 연구에 활용하고 있는 제뉴이티는 델 EMC 아이실론 기반 통합 인프라 매니지드 서비스로 자원 낭비를 최소화하면서 기술 개발 본업에 집중할 수 있게 됐다. 또한, 주 사용 데이터와 아카이브용 데이터의 특성에 맞게 다양하게 제공된 아이실론 플랫폼을 하나의 동일한 인터페이스와 클러스터로 구성함으로써 더욱 쉽고 효율적으로 관리하고 있다.

시장조사기관 IDC에 따르면 기업 비즈니스의 딥러닝 기반 AI 개발에 활용되는 비정형 데이터의 양은 지난 10년 동안 매년 약 60%에서 80%까지 폭발적으로 증가한 것으로 나타났다. 앞으로도 데이터센터 시장에서 비즈니스 혁신 및 차세대 시스템과 서비스 개발을 위해 더욱 진보한 AI를 요구하는 만큼 델 EMC 아이실론같은 고효율 비정형 데이터 전문 스토리지 플랫폼과 통합 AI 인프라의 수요 또한 더욱 늘어날 전망이다.

기자의 전체기사