인공지능(AI)에서 가장 중요한 요소는 데이터다. 관점에 따라서는 고성능의 AI 엔진을 꼽을 수도 있지만, 연료 없이 자동차가 운행할 수 없듯 인공지능 또한 데이터라는 연료를 통해 인간의 사고를 뛰어넘는 결과값을 도출해 내는 것이다.

인공지능 기반의 비즈니스 모델을 구축하는 기업들이 데이터의 중요성을 뼈저리게 느끼는 이유도 여기에 있다. 그럼에도 불구하고 기업 상당수는 데이터 수집 및 가공 단계에서부터 많은 실패를 겪고 있다. 설령 그 단계를 넘어섰다고 해도 분석 단계에서 처음에 계획하고 기대했던 결과를 얻지 못해 그 프로젝트를 ‘잠정 중단’으로 처리하기 일쑤다.

실패 또는 기약 없는 중단에는 여러 원인이 있다. 이에 대해 서울대학교 조성준 교수는 기획 단계가 원인일 가능성이 높다는 입장을 밝힌 바 있다. 시작점부터 데이터를 통해 어떤 가치를 얻고자 하는지가 명확하지 않았기 때문에 데이터 수집, 가공, 분석을 거쳐 얻어지는 인사이트에 만족할 수 없게 된다는 것이다.

조성준 교수가 인공지능 융합 비즈니스 개발 컨퍼런스(AI Tech) 2022에서 발표한 내용을 토대로 AI 빅데이터 기반 비즈니스 모델 구축에서 기획의 중요성을 정리했다.

AI 빅데이터 기반 비즈니스 모델의 성공을 위해서는 기획부터 제대로 해야 한다. / 픽사베이
AI 빅데이터 기반 비즈니스 모델의 성공을 위해서는 기획부터 제대로 해야 한다. / 픽사베이
데이터 인사이트의 가치

데이터를 통한 비즈니스 실행은 결국 원하는 가치를 얻어내는 것에 있다. 데이터를 분석하고 인사이트를 얻은 후 검증하고 액션까지 이뤄지는 과정도 모두 ‘가치를 얻는다’는 하나의 큰 목적 안에 존재한다.
가치를 잘 만들기 위해서는 어떤 인사이트가 필요하며, 이를 위한 데이터는 무엇인가를 생각해봐야 한다. 음식 재료로 비유해 본다면, 식재료가 데이터이고, 셰프가 만든 요리가 인사이트다. 그리고 손님이 그 요리를 먹으면서 느끼는 만족감이 가치다.

데이터 처리 구조는 크게 봤을 때 빅데이터 → 데이터 분석 → 비즈니스 액션으로 볼 수 있다. 데이터 수집과 분석은 엔지니어, 리서처 등의 전문가들이 담당하고 비즈니스 액션은 담당 임직원들이 맡는다. 따라서 데이터를 바라보는 관점도 두 영역이 돼야 한다. 분석하는 사람과 액션을 취하는 사람이다. 액션을 취하는 사람에는 기업 마케터, 제품 기획자, 인사, 구매 담당자 등 다양할 수 있다. 바꿔 말하면 이들이 데이터를 통해 어떤 가치를 얻어내야 하는지 알고 있는 사람들이다.

데이터를 통한 인사이트의 세 가지 특징

이제까지는 경험을 기반으로 한 전문 지식에 의존해 인사이트를 얻었다. 하지만 환경마다, 사람마다 다르게 받아들여지기 때문에 객관적이라고 보기 어렵다.

데이터를 통한 인사이트는 세 가지 특징이 있다. 먼저 객관적이다. 가령 지하철 내부 환경이라고 한다면 사람에 따라 더울 수도 적당할 수도 있다. 하지만 데이터 관점에는 24℃일 뿐이다. 이를 기반으로 인사이트를 얻고 가치를 만드는 것이다.

두 번째는 ‘다 같은 vs 다 다른’이다. 과거에는 많은 사람들이 9시에 9시 뉴스를 봤다. 하지만 지금은 9시에 각자의 환경에서 시간을 보낸다. 휴대폰 게임을 할 수도 있고 유튜브나 OTT(Over The Top media service)를 보거나 그도 아니면 공부나 운동을 할 수도 있다. 여기에서 각 개인마다의 데이터가 발생된다. 그 데이터에 맞춰 서비스를 제안하거나 광고를 전달할 수 있는데, 이 것이 ‘데이터 드리븐’이다.

세 번째는 ‘24/7’이다. 24시간 7일 내내 사람들은 온라인 환경 안에 놓여 있다. 이 안에서 쉼 없이 데이터를 생성한다. 은행을 예로 들면 과거에는 오후 4~5시 이후에는 은행 업무를 할 수 없었지만 지금은 시간에 구애 없이 송금하고, 예금 들고, 대출 받는 거의 모든 은행 업무를 할 수 있게 됐다.

빅데이터, 제품 개발에도 쓸 수 있다

데이터를 활용해 새로운 비즈니스 모델을 구축하고, 비용을 절감하고, 업무 효율성을 높이는 사례는 많다. 특히 데이터는 막연한 추측이 아닌 충분한 가능성을 제시한다.

한 예로 오븐의 판매 실적 향상을 위한 데이터 전략을 들 수 있다. 제조사 입장에서는 자사 제품에 대해 소비자들의 사용 데이터가 판매 규모를 결정할 수 있는 요소가 된다.

오븐과 관련된 데이터를 수집해 보니 집, 엄마, 간식, 정성, 맛 등의 관련 단어가 등장했다. 엄마, 정성, 맛, 집 이런 단어는 어느정도 예상되는 데이터다. 하지만 귀찮음, 실패라는 단어도 등장했다. 왜 이런 단어가 등장했는지 살펴보면 여러 요인들을 파악해볼 수 있다. 그 중 하나는 기계마다 설정 온도가 달라 레시피대로 요리해도 실패한다는 사실이다.

오븐 제조사라면 소비자들의 사용 데이터를 통해 마케팅 전략을 다시 구성 수 있다. / 조성준 교수
오븐 제조사라면 소비자들의 사용 데이터를 통해 마케팅 전략을 다시 구성 수 있다. / 조성준 교수
제조사는 이를 바탕으로 기계의 특성(용량, 가열 속도 등)에 맞는 레시피 ‘기계 맞춤형 레시피’를 공유하면 부정적 단어들을 어느정도 해결할 수 있다. 사용자들이 인터넷에 떠도는(올린 사람이 어떤 오븐을 사용하는지도 모르는) 레시피가 아니라 자신의 기계에 맞는 레시피를 따라하게 되기 때문이다. 이렇게 비즈니스 액션이 나온다.

하지만 이제까지는 판매 실적이 저조하다고 하면 ‘왜 저조한지’에 대한 고민보다 가격을 낮추자는 제안이 먼저 나오는 것이 일반적이었다. 이 방법은 대증요법이다. 즉, 증상만 없애겠다는 것인데, 이렇게 되면 악순환이 될 수밖에 없다.

AI 빅데이터, 어떻게 추진해야 하는가?

AI 빅데이터 기반 비즈니스 추진은 크게 네 단계다. 기획(Plan) → 분석(Do) → 검증(Check) → 실행(Act).

기획은 데이터를 어떻게 처리하고 원하는 가치를 얻을 것인지 설계하는 단계이고, 분석은 데이터를 분석해 인사이트로 바꿔주는 단계다. 검증은 얻어진 인사이트를 체크하는 과정이고, 실행은 인사이트에서 나온 결과를 실행해서 가치를 만드는 과정이다.

여기서 중요한 부분은 기획이다. 기획은 데이터 처리 과정과 반대로 흐른다. 데이터 처리 과정은 데이터를 수집하고 분석해서 인사이트를 얻고 거기에서 가치를 찾는 방식인데, 기획은 원하는 가치가 무엇인지를 찾는 데서부터 시작된다. 그 다음 그 가치에 맞는 인사이트는 무엇이고 그 인사이트를 얻기 위해서는 어떤 데이터가 필요한가로 진행된다.

어깨가 아픈 환자가 있다고 가정해보자. 이 환자가 원하는 가치는 아픈 어깨가 낫는 것이다. 그 가치를 얻기 위한 인사이트에는 병원을 가는 방법, 약국을 가는 방법, 며칠 더 놔두는 방법 등이 있을 것이다. 병원을 가는 인사이트를 얻기로 결정했으면 엑스레이 촬영 데이터, 의사의 진단 데이터가 발생되는 것이다.

넷플릭스는 고객 데이터를 활용해 추천 방식으로 시청을 유도한다. / 넷플릭스
넷플릭스는 고객 데이터를 활용해 추천 방식으로 시청을 유도한다. / 넷플릭스
넷플릭스가 빅데이터를 통해 얻고자 하는 가치는 사람들이 더 많이 시청하도록 유도하는 것이다. 넷플릭스의 기존 전략은 ‘100만개의 영상이 있으니 원하는 영상 검색만 하면 다 볼 수 있다’는 것이었다. 하지만 사람들은 100만 개 영상 리스트를 볼 수도 없고, 어떤 영화가 재미있는지도 모른다. 넷플릭스는 어떻게 해야 사람들이 많이 볼 수 있도록 가이드 할 것인가에 초점을 맞추고 전략을 다시 설계했다. 그 방법이 지금은 흔히 쓰이는 ‘추천’ 방식이다. 고객의 시청 기록을 보고 관심 있을 만한 영화를 데이터로 판단해 그에 맞게 관련 영화를 추천해준다.

추천 영화 데이터를 산출하는 근거 또한 고객들의 시청 데이터다. 과거에 비슷한 영화를 본 사람들이 시청한 데이터와 최근 인기를 끌고 있는 영화 데이터 등을 분석해 추천하는 것이다. 여기에는 엄청난 양의 데이터가 필요한데, 최근에는 이를 보다 쉽게 처리할 수 있게 됐고, 웹사이트 방문 기록, SNS 크롤링, 웹페이지 로그 기록 분석을 통해 소비자들의 행동패턴 분석과 예측이 가능해졌다.

아마존닷컴도 고객 사용 내역을 통해 누가 어떤 제품을 구매했는지에 대한 데이터를 통해 추천을 한다. 실제 매출의 40%가 추천에 의한 구매다.

빅데이터 관련 R&R

빅데이터 관련 업무(R&R)에는 6가지 유형이 있다.

① 데이터 엔지니어

엔지니어는 데이터의 수집, 저장, 가공 업무 즉, 데이터 파이프라인을 구축 및 관리하는 일을 한다. 또 데이터 분석 업무도 맡는다. 엔지니어는 데이터 파이프라인에 필요한 기술과 프로그래밍 및 데이터 분석 능력, 시각화 기술 등을 갖추고 있어야 한다.

② 데이터 사이언티스트

데이터 사이언티스트는 데이터를 수집하고 가설과 추론을 개발한 다음 머신러닝을 사용해 해당 데이터 내의 패턴, 관계 및 추세를 감지하는 일을 한다.

③ 리서처

리서처는 다양한 데이터 분석 방법을 개발하는 일을 한다.

④ 애널리스트

애널리스트는 데이터 사이언티스트나 리서처들이 만들어놓은 분석 솔루션을 이용해서 실제 데이터를 가지고 분석하는 일은 한다.

⑤ 시티즌 데이터 사이언티스트

시티즌 데이터 사이언티스트는 데이터 분석을 하고 비즈니스와 연계하는 일을 한다. 데이터 사이언티스트 만큼의 분석 수준을 갖추지는 않지만 최근 데이터와 비즈니스를 통합적으로 이해할 수 있는 직군으로 각광받고 있다.

⑥ 기획자

기획자는 해당 조직에서 어떤 가치가 필요하고 이를 위해 어떤 인사이트를 얻어야 하는지, 어떤 데이터가 필요한지를 큰 틀에서 설계하는 일을 한다. 이 업무는 데이터 전문가가 아닌 담당 임직원이 주로 맡게 되지만 데이터에 대한 이해는 반드시 갖추고 있어야 한다.

최근에는 모두가 코딩을 알아야 하고 데이터 사이언티스트가 되어야 데이터 분석과 비즈니스 가치를 얻을 수 있다고 한다. 특히 일부 기업들은 모든 직원들에게 코딩 교육을 필수로 시키기도 하는데, 매우 비효율적이다. 최근 시티즌 데이터 사이언티스트가 이슈되는 이유도 맥락을 같이 한다.

기획을 하는 경우라면 앞서 언급했 듯 우리 회사에 어떤 가치가 필요하고, 어떤 인사이트가 필요하며 이를 위해서는 어떤 데이터가 필요한지를 파악할 수 있는 정도의 지식과 각 섹터마다 투입되는 요소(아웃소싱, 엔지니어, 사이언티스트, 리서처)를 배치할 수 있는 역량만 있으면 된다.

조상록 기자 jsrok@chosunbiz.com


관련기사