[버나드의 투자 이야기]한국이 선도하는 차세대 골드러쉬 '데이터 산업'

  • 버나드 문 스파크랩 공동대표
    입력 2019.08.26 06:00

    IT조선은 버나드 문(Bernard Moon) 스파크랩 창업자 겸 공동 대표 칼럼을 국문과 영문으로 전합니다. 문 대표는 시시각각 변하는 세계 스타트업 투자 동향을 전하고 투자자로서 치열한 고민을 독자와 함께 나눌 예정입니다. [편집자 주]

    프랭크 미한 스파크랩스 글로벌 공동창립자는 5년 전 "미래는 데이터에 있다"며 "우리는 사용 패턴, 고객 행동, 회사 정보와 관련한 귀중한 데이터를 생성하는 회사에 투자하려 한다"고 시드투자 당시 회사 목표를 설명했다.

    데이터 산업은 비판적 사고로 스타트업을 살펴볼 수 있는 눈을 키워줬다. 펀드 초기 3년 동안은 수백만 개의 데이터 포인트를 수집할 사물인터넷(Internet of Things) 관련 신생 기업을 주로 살펴봤다. 대부분의 회사는 당시 데이터 비용을 지불하지 않으려 했다. 많은 산업은 디지털 융합 시대에 들어선 지금에 와서야 데이터 중요성을 깨닫기 시작했다. 예를 들어 보험과 같은 산업은 데이터와 정보에 기반을 두고 있는데도 불구하고 당시에는 그러했다.

    지난 몇 년 동안 나는 스타트업이 여러 산업에서 데이터를 수집하고 분석해 제공하는지를 지켜봤다. 그 결과, 포츈 1000대 기업은 이렇게 생성된 데이터에 더 많은 돈을 투자하려는 움직임이 있었다.

    산업 제조 분야와 검색 및 소셜 미디어 데이터 분야 등 업종은 데이터 정보·분석 측면에서 볼 때 ‘오랫동안 확립되어온 금광’과 같다. 스타트업 포트폴리오와 데이터 분석이 마침내 가치를 부여받는 시대가 왔기 때문이다. 데이터는 회사 성공의 핵심이 됐다.

    선구적 역할하는 한국

    세계 정부 중 일부는 데이터 산업에서 더 많은 혁신을 일으키고자 시도를 한다. 한국은 그 중 하나다. 1993년 설립된 한국데이터산업진흥원은 지난 몇 년 동안 데이터 산업 개발을 장려해왔다. 스파크랩스 코리아 포트폴리오 회사 중 일부는 매년 수십만달러(USD)를 지불하며 데이터를 대중에 공개한다. 한국데이터산업진흥원은 금융, 헬스케어, 운송 등 분야에서 활용될 수 있는 데이터 표준을 구축하기 위해 컨소시엄을 구축했다.

    개인적으로 정부가 가장 잘 할 수 있는 역할은 (산업에) 지나치게 개입하지 않는 것이라 본다. 오히려 이러한 개입이 시장에 더 많은 해를 끼치기 때문이다. 그러나 한국의 경우는 살짝 다르다. 한국데이터산업진흥원이 펼친 정책은 긍정적 영향 그 이상을 부여하기 때문이다.

    한국이 취한 이러한 정책과 접근 방식은 경제성장과 혁신 창출을 위해서라면 세계 국가가 따라야 한다.

    추출 데이터(Cultivated Data)는 금이다

    '추출 데이터'란 ERP 데이터나 구글 애널리틱스, 공중보건데이터 등 기존 데이터를 분석해 더 유용한 결과값을 불러오는 새로운 데이터를 일컫는다. 빅데이터처럼 막대한 양의 컴퓨팅 성능을 사용하는 복잡한 데이터 세트라기 보단 이전에 사용되지 않은 데이터 세트에 대한 새로운 접근 방식이다. 추출된 데이터는 데이터 크기와 다양성, 속도와 관련성을 띄지 않는다. 오히려 추출된 데이터를 활용할 수 있느냐가 관건이다.

    스파크랩스 글로벌 벤처가 투자한 회사 중 데이터 분야와 관련해 가장 처음으로 투자를 집행한 업체는 ‘42 테크놀로지(42 Technologies)’다. 42 테크놀로지는 주로 POS(Point of Sale·판매 시점에서 컴퓨터로 판매 활동을 관리하는 시스템) 데이터를 분석해 소매점들이 쉽게 재고를 관리할 수 있도록 했다. 현재 42 테크놀로지 데이터 분석 솔루션을 사용하는 소매 브랜드는 올세인츠와 레베카 밍코프, 파헐티 브랜드 등이다. 42 테크놀로지는 이들 소매 업체에 판매 데이터와 재고 데이터 등 다양한 데이터 세트를 제공한다.

    데이터를 핵심 상품으로 꼽지 않는 회사도 데이터가 새로운 수익 라인을 형성한다는 사실에 눈을 뜨고 데이터 가치를 인정한다. 특히 틈새 전자상거래(Niche e-commerce)와 사료, 소비자 리뷰에 이르기까지 예상치 못한 영역에서는 데이터를 주요 수입원으로 본다.

    그 예로 30억달러의 수익을 창출하는 대형 가전제품 제조업체 비지오(Vizio)는 옵트인 방식의 스마트TV 시청 데이터 소스를 축적했다. 비지오는 이 사업을 토대로 인스케이프라는 영향력있는 자회사를 세웠다.

    새로운 데이터 업체의 출현

    추출 데이터로 인한 뉴에이지는 새로운 데이터 기업을 생성한다. 기존 스타트업이 중개인 개념을 파괴하는 것이 아니라, 새로운 스타트업이 데이터 중개인 역할을 자처하는 셈이다.

    스파크랩스 글로벌 벤처 포트폴리오 회사 중 하나인 파퓰러스는 모빌리티 데이터 관리 및 분석 스타트업이다. 승차 점유율과 스쿠터 쉐어, 자전거 쉐어, 교통량, 대중교통 및 기타 모빌리티 소스 데이터를 집계해 도시계획가 등에 제공한다. 대부분 도시는 파퓰러스가 아니라면 관련 자원 또는 지식을 얻기 힘들었을 것이다.

    스파크랩스 코리아가 투자한 차트메트릭은 스트리밍 서비스 산업에서 빼놓을 수 없는 업체다. 음악 산업에서 ‘자원’하면 차트메트릭이라고 바로 대답할 정도로 빠르게 자리잡았다. 새로운 데이터 업체로 거듭나는 차트메트릭은 데이터 추출에 그치지 않고 고객이 어떤 식으로 활용할지를 판단해 데이터를 더 추출하도록 했다. 차트메트릭은 신뢰할 수 있는 데이터 및 데이터 인사이트 원천이 됐다. 다른 음악 레이블과 밴드가 숫자를 다르게 보고할 수도 있지만, 정확한 데이터 추출로 이러한 문제를 쉽게 피할 수 있기 때문이다.

    시장에서 신뢰할 수 있는 데이터 등을 찾는다는 가정 아래, 앞으로 몇 년 동안은 이러한 데이터 중개업체가 많이 생겨날 것이라고 본다.

    ‘데이터 과학자’라고 칭할 수 없는 이 시대 데이터 과학자

    구글과 페이스북 등 첨단 기술 업체들이 기술 인재를 잡아 두면서 포츈 500 기업은 AI 전문가와 데이터 과학자 확보에 어려움을 겪는다. 그 결과 내 자신이 데이터 과학자 역할을 할 수 있도록 돕는 분석 플랫폼이 부상했다.

    한 예로 쏘트스팟(라이트스피트와 코슬라 등으로부터 3억달러 조달)과 록세트(그레이락과 세콰이어로부터 2200만달러 조달), 팔콘리(스파크랩스 포트폴리오 회사)는 시장에 각각의 방법으로 다가갔다. 쏘트스팟은 실시간 분석 및 검색 기능을 제공했다. 록세트는 대기업용 검색 및 분석 서비스에 중점을 뒀다. 팔콘리는 산업 운영과 관련한 예측 분석에 중점을 뒀다.

    분석 플랫폼 산업은 앞으로 몇 년간 활발하게 제 역할을 할 것으로 본다. 이러한 새로운 접근 방식은 부족한 인재 확보 능력 등 면모를 채울 것이라고 기대한다.

    ※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

    버나드 문은 스타트업 액셀러레이터와 벤처캐피털 펀드를 운용하는 회사를 보유한 스파크랩 그룹의 공동 창업자이자 파트너입니다. 2012년 출범한 스파크랩스코리아는 이 그룹의 첫 번째 액셀러레이터입니다. 이 그룹은 2018년 현재 중국, 홍콩, 대만 등에도 액셀러레이터를 운영 중입니다. 스파크랩스글로벌벤처스는 시드 단계의 글로벌 펀드 회사이며 스파크랩스캐피탈은 후기 단계의 투자 회사입니다. 또 스파크랩스벤처스는 한국에서 운영하는 초기 펀드 회사입니다.

    <원문>
    Cultivated Data Is the Next Gold Rush And Korea is Leading Again

    Five years ago, Frank Meehan, my SparkLabs Global Co-founder, described the goal of our seed-stage fund as follows:

    "The future is data. We are looking to invest in companies that are generating valuable data around usage patterns, customer behavior, company information."

    It was prescient—it has guided us well over the years, but also allowed us to look at relevant startups with a critical eye. During the first three years of our fund, we would look at startups—especially in the Internet-of-Things space—that would collect millions of data points, but most companies weren’t willing to pay for such data. Although industries such as insurance are built on data and information, many industries are just beginning to grasp the importance of such insights, especially as our lives integrate into the digital world.

    These past few years, I’ve seen a general trend of startups improving how they collect, analyze, and present data across numerous industries, and Fortune 1000 companies becoming more willing to pay for such cultivated data.

    Industrial manufacturing, search and social media data, and a handful of other verticals are long-established gold mines for data information and analytics.
    What we’re seeing now is that across our portfolio of over 250 startups, data and analytics is finally being valued and becoming mission critical: it is no longer "just another tool" to have in the toolbox, but core to a company’s success.

    Korea is Trailblazing Again

    One interesting thing is how our firm has seen some governments spurring more innovation within the data space. In South Korea, the Korea Data Agency, which was established in 1993, has been encouraging the development of a data marketplace over the past years. Some of our SparkLabs Korea portfolio companies get paid a few hundred thousand (USD) per year to open up their data to the public, and the Korea Data Agency has created vertical consortiums to encourage standard building for data structures within specific industries such as finance, healthcare, and transportation.

    I typically believe government’s best role is not to do too much, especially since it can do more harm to a market and impact market forces in a negative manner. But the Korea Data Agency’s policies and actions within this realm is more than positive. If I can ever say a government’s policy moves is awesome like when I comment on a NBA player’s moves on the court, this would be the situation.

    These are policies and approaches should be followed by other nations across the globe to create more opportunities for economic growth and startup innovation.
    Cultivated Data Is Gold

    I define "cultivated data" as existing data (i.e., ERP data, Google Analytics, public health data, inventory data) that is analyzed and developed into a more usable form than it was before. This doesn’t have to be the complex data sets using inordinate amounts of computing power that signifies "big data," but approaches and techniques to data sets that previously weren’t utilized. Cultivated data isn’t always about volume, variety, or velocity of data—it’s more important for the output to be relevant and actionable.

    One of our first SparkLabs Global Ventures investments in this space was 42 Technologies. Retailers such as Rebecca Minkoff, AllSaints, Faherty Brand, and others have found 42 Technologies’ data analytics invaluable. When 42 Technologies graduated from Y Combinator it primarily analyzed point-of-sale data to find diamonds in the rough in retailers’ inventory. Today, the company has expanded to using wholesale sell-in data, sell-through data, warehouse inventory data, and other data sets to provide multiple insights to retailers.

    Even for companies whose core product isn’t data, the data that they have access to has become extremely valuable, so new revenue lines are being created. We’ve seen this in less expected areas—ranging from niche ecommerce to pet food to consumer reviews—where for some of these companies, data has become one of the primary sources of revenues.

    For example, Vizio, a large consumer electronics manufacturer (over $3 billion in revenue), has accumulated the largest single source of opt-in smart TV viewing data available; it launched an influential subsidiary around this business called Inscape.

    The New Data Aggregators

    This new age of cultivated data has created and will create new data aggregators. Instead of traditional startups attempting to disrupt the middleman, this new wave of startups are becoming the middlemen of data insights.

    A mobility data management and analytics startup called Populus (a SparkLabs Global Ventures portfolio company) aggregates ride share, scooter share, bike share, traffic, public transit, and other mobility source data to present actionable insights for city and transportation planners. Most cities would not have the resources or knowledge to do what Populus does.

    One of our SparkLabs Korea accelerator investments, Chartmetric, is rapidly becoming the go-to resource for the music industry in today’s streaming world. It has become a new data aggregator, as company founder and CEO Sungmoon describes, because Chartmetric "distills the data and distills further until they get something actionable" for its customers. Additionally, Chartmetric has become a trusted source of data and data insights, as different music labels and bands might report their numbers quite differently.

    In the years to come, we expect to see more of these new data middlemen—because of similar "trusted source" issues, the shortage of good data scientists, and some will want to create their own future and launch their own startups.

    No Data Scientists Is the New Data Scientist

    The lack of AI experts is making it hard for even Fortune 500 companies to recruit them, with Google, Facebook, and other top tech companies hoarding such talent. And it’s not only great AI developers, but even data scientists, whose positions are becoming harder to fill. One outcome is the rise of analytics platforms that empower people to become their own data scientists.

    For example, companies such as Thoughtspot (raised over $300 million from Lightspeed, Khosla, and others), Rockset (raised over $21 million from Greylock and Sequoia), and more specialized plays such as Falkonry (one of our portfolio companies) have each taken different approaches to the market. Thoughtspot provides real-time analytics and search and query capability across multiple sectors. Rockset seems focused on search and analytics query services for large enterprises. Falkonry focuses on predictive analytics for industrial operations, a much narrower focus than the other two examples.

    This analytics platform space will only heat up in the coming years, and I expect other new approaches to fill this lack of talent and capabilities within company walls.


    From well-coordinated government policies to market forces to increased startup activity around cultivated data, these trends and developments are a harbinger that this space will be one of the major gold rushes for startups and venture capital over the coming years. Data is truly the future, and the time to stake claims to mine it for insights and prosperity is now,

    ※ Contributors' articles may not agree with the editing direction of ITChosun.

    Bernard is Co-founder of SparkLabs Group, which is comprised of SparkLabs Accelerator, Asia’s premier accelerator network, with operations in South Korea (1st launched in 2012), China, Hong Kong and Taiwan (2018). SparkLabs Global Ventures, a global seed-stage fund; SparkLabs Capital, a late stage investment vehicle, and SparkLabs Ventures, a new early-stage fund for South Korea.