[AWS 2018] "빅데이터 분석, 비전문가도 쉽고 빠르게"

입력 2018.04.18 17:04

크레이그 스터스(Craig Stires) 아마존웹서비스(AWS) 아시아 태평양 지역 빅데이터 사업 개발 부사장은 18일 열린 'AWS 서밋 서울 2018'에서 '데이터 분석을 통한 비즈니스 혁신'을 주제로 강연을 진행했다.

데이터 분석 모델을 설명하는 크레이그 스터스 부사장. / 백승현 인턴 기자
크레이그 스터스 부사장은 빅데이터를 효과적으로 활용하려면 비전문가도 쉽게 사용할 수 있는 데이터 플랫폼이 필요하다고 강조하며 AWS 데이터 관리 플랫폼을 소개했다. 또한 사용자의 눈높이에 따라 노출되는 데이터의 형태가 달라야 하기에 프로젝트에서 다양한 데이터 툴(Tool)을 사용할 것을 권장했다.

그는 비전문가도 쉽게 사용할 수 있는 데이터 플랫폼의 한 예로 '레드시프트(Red Shift)'를 소개했다. 설명에 따르면 레드시프트는 AWS의 데이터 웨어하우스(Data Warehouse)로 데이터 분석 결과를 보기 쉽게 시각화해준다. 또 설계 초기 단계부터 확장성을 염두에 둬 대용량 데이터를 처리하기 용이하다. 특히 쿼리(Query)처리 속도가 빠르며 비용은 전통적인 데이터 웨어하우스의 10분의 1 수준으로 경제적이다.

최근 비정형 데이터의 수요가 늘면서 데이터를 보관하는 데이터 스토리지(Data Storage)의 중요성이 부각됐다. 이에 이전보다 크고 다양한 형태의 데이터를 저장해야 하기 때문에 저렴한 데이터 스토리지가 주목받는 추세다. 이런 맥락에서 크레이그 스터스 부사장은 데이터 스토리지로는 'S3'를 소개했다. S3는 정형 및 비정형 데이터가 한 곳에 모이는 저장 형태인 '데이터 레이크(Data Lake)'를 구축하기에 적합한 스토리지로 타제품에 비해 사용료가 저렴한 것이 특징이다.

이 밖에도 빅데이터 분석과 기계학습을 AWS 플랫폼으로 적용한 예로 '음성 및 공간 분석을 통한 음악 추천' 모델을 설명했다. 사용자가 '조용한 음악을 추천해줘'와 같이 원하는 음악의 분위기를 말하고 주변 사진을 찍어 보내면 이에 맞는 음악을 추천해 주는 시스템이다. 이 시스템은 영상처리 플랫폼 '아마존 레코그니션(Amazon Rekognition)'이 적용되며 사용자로부터 받은 사진과 기존 데이터베이스의 정보를 비교·분석해 현재 상황의 분위기를 판별하고 그에 맞는 음악을 추천한다.

크레이그 스터스 부사장은 "이전에는 데이터 분석을 하는데 많은 시간과 노력이 들었으나, AWS 플랫폼을 사용하면 비전문가도 쉽고 빠르게 데이터를 이용할 수 있다"고 말했다.