소프트웨어 전문지 마이크로소프트웨어 395호는 데이터과학을 주제로 담았습니다. 데이터과학에 대한 개론, 학습 방법, 실무 적용 사례, 학계 등 마소 395호 주요 기사들을 IT조선 독자에게도 소개합니다. [편집자주]

지난 20여 년 동안 업계에서는 고객 데이터 공유를 위해 다양한 혜택을 제공하는 비즈니스 모델을 선보여왔다. 한 예로 고객에게 무료 이메일 계정을 제공하는 혜택이다. 서비스 이용약관에는 데이터 사용방안 및 고객 권리와 책임이 명시돼 있다. 하지만 고객은 데이터에 대한 권한을 모르거나, 심지어 데이터가 무엇인지도 모른다.

이메일 서비스 제공 업체는 실제 고객이 주고받는 이메일 속 내용과 메타 데이터를 사용한다. 어떻게 보면 이메일 업체의 실제 서비스 고객은 ‘이메일 사용자’가 아닌, 이메일 기반 빅데이터 상품을 구매하는 ‘광고주’라고 할 수 있다. 소셜 네트워크도 사용자가 데이터 권한을 갖는다고 생각할 수 있지만, 실제로는 서비스 제공자가 데이터 사용 권한을 가지고 있다.

데이터 권한 비대칭은 지난 20여 년 동안 웹 서비스 발전으로 이어졌고, 이는 FAANGs(Facebook, Apple, Amazon, Netflix, Google)와 같은 강력한 기업을 탄생시켰다. 하지만 데이터 권한 비대칭은 이제 과거 모델이 될 것이다.

유럽뿐 아니라 아시아, 북미를 시작으로 개인 정보에 대한 인식과 정보 보호에 대한 기대 수준은 점점 높아지고 있다. 유럽연합에서 진행하는 GDPR(General Data Protection Regulation)은 ICT와 IoT 시스템의 글로벌 기술 표준으로 급부상하고 있으며, 설계 단계에서부터 개인정보보호가 반드시 반영될 것을 요구하고 있다.

현재 자동차, 숙박 시설 등 물리적 자원의 공유경제 플랫폼은 중앙에서 기업이 모든 정보를 관리한다. 이는 다시 데이터 권한 비대칭을 초래한다. 하지만 분산 기술 발전에 따라 중앙에서 데이터를 통제하는 플랫폼은 대부분 사라질 것이다.

기존 중앙화된 시스템에 분산형 인공지능을 적용할 경우 흥미로운 방법으로 공유경제를 활성화할 수 있다. 자동차 산업을 예로 보면, 미래에 운전자는 자동차에 모이는 데이터에 머신러닝 알고리즘을 적용할 수 있다. 또한, 제 3자에게 데이터를 판매할 수 있다. 데이터 공유로 생긴 수익금은 데이터 수집에 기여한 사용자들에게 분배된다.

정보 공유 산업 발전의 핵심은 데이터에 대한 접근 절차, 판매 절차, 데이터 중복 공개 불가 등이다. 정보는 기업의 경쟁력이기 때문에 기업이 데이터, 자원 또는 지식 공유를 꺼리는 것은 당연하다. 그러나 최근 새로운 상품을 제공하거나 비용 절감을 위해 자사 리소스와 서비스 공유를 검토하는 추세다.

철도산업의 인프라와 수송에는 다양한 이해 관계자가 존재하며, 높은 수준의 협력이 요구된다. 철도 차량 제조업체, 철로 및 교통 통제 관리업체, 철도 정비업체, 철도 장비 점검업체 등은 많은 정보를 공유해야 한다. 하지만 기존 프로세스는 임시방편인 애드혹(ad-hoc) 방식이며, 정보 신뢰성 또한 낮다. 그 때문에 보수적인 대다수 기업은 데이터 공유에 적극적으로 참여하지 않는다.

기업의 이런 행동 방식이 비용 최적화 기회를 놓친다. 점검업체 인가 표준 공유 인터페이스를 통해 철로관리업체에 데이터를 전송하면, 철로관리업체는 자체 IT 관리 시스템에 데이터를 수동으로 재입력할 필요가 없다. 또한 데이터나 인공지능 기반 지식자산을 유사 경쟁업체에 판매할 수 있고, 제조업체 또한 정비업체에서 수집된 정보를 가공해 철도차량에 대한 예측 유지보수와 안전 프로세스 개선을 위한 데이터를 판매할 수 있다.

정보 공유에 대한 소극적 태도는 결국 많은 기업이 얻을 수 있는 경제적 가치 창출을 막는다.

철로관리업체는 직속 협력사로만 이뤄진 데이터 집합뿐 아니라, 유사한 환경의 다른 지역 제공자의 데이터 집합 관련 머신러닝도 원하게 될 것이다. 인공지능 알고리즘에서 더 가치 있는 지식과 통찰력을 얻기 위해서는 유사한 환경 내 더 다양한 데이터 세트 취합이 필수적이다. 그러나 일반적으로 서로 다른 기업의 데이터 세트를 빅 데이터 세트로 통합하고 이후 분석하는 것은 실현할 수도 없고, 바람직하지도 않다. 정부 규정으로 인해 데이터 반출이 불가능하고, 데이터 세트 내 지적 재산 또는 보호해야 할 개인정보가 포함될 수 있어, 기업이 데이터 마이그레이션을 꺼릴 것이기 때문이다.

자인 단체사진. / 자인
자인 단체사진. / 자인
2017년 2월 독일 베를린에 설립된 자인(XAIN, eXpandable AI Network)은 머신러닝 한 분야인 강화학습(Reinforcement Learning)과 혁신적인 2단계 합의 알고리즘을 사용하는 커널 작업증명 방식(PoKW: Proof-of-Kernel-Work)을 블록체인에 구현하는 프로젝트로 시작됐다. 자인은 ‘세상 모든 지능형 시스템이 협업과 신뢰가 있는 세계’를 비전으로 한다.

자인은 데이터, 리소스 및 지식을 공유할 수 있는 지능형 시스템을 개발했다. 지능형 시스템은 사용자와 기업 간 신뢰와 투명성을 높이기 위해 블록체인 기술이 적용된 접근 권한 체계를 제공한다. 데이터, 기계, 장치 권한을 사용자가 완전히 제어할 수 있고, 머신 네트워크에 서드파티(3rd Party)를 안전하게 연결해준다.

또한 자동차 산업을 위한 디지털 인프라 솔루션을 전문적으로 제공한다. 특히, 독일 스포츠카 전문 회사 포르쉐(Porsche)와 협력해 PoC(Proof of Concept, 개념증명)를 성공적으로 수행했다. 포르쉐는 자사 파나메라 차종에 블록체인 기술을 적용해 공유와 제어 기능을 한 단계 올렸다.

마이클 후스, 임현민 필자의 ‘XAIN, 확산형 AI 네트워크’에 대한 자세한 내용은 ‘마이크로소프트웨어 395호(https://www.imaso.co.kr/archives/4654)’에서 확인할 수 있다.