[IT조선 박상훈] 데이터는 문자 그대로 '돈'이다. 소비자 개인의 관심사를 정확히 파악할 수 있다면 이에 맞는 제품과 서비스를 판매할 가능성이 크게 높아진다. 기술적인 측면에서도 소셜 네트워크 서비스(SNS)와 스마트폰 등 수집할 수 있는 개인 정보가 크게 늘어났다. 기업들이 소비자 개인에 대해 정보를 모아 경영에 활용하는 이른바 '빅데이터(Big data)' 투자를 늘리는 이유다.

그러나 모든 기업이 이를 수집, 분석할 수 있는 여건과 능력을 갖춘 것은 아니다. 관련 하드웨어와 소프트웨어, 인력을 갖추는 것은 중견 기업 이상이라고 해도 큰 부담이다. 이 때문에 소비자의 개인 정보를 전문적으로 수집해 재판매하는 기업, 즉 '데이터 브로커(Data Broker)'가 등장했다. 이들은 여러 경로로 데이터를 수집하는데, 대표적인 데이터 브로커인 '액시엄(Acxiom)'은 전 세계 7억 명의 소비자 정보를 갖고 있다. 액시엄은 미국 대선에서 오바마의 당선을 도운 것으로도 유명하다.

미국 내 주요 데이터 브로커 현황 (표=정보통신정책연구원)
미국 내 주요 데이터 브로커 현황 (표=정보통신정책연구원)
문제는 이들 데이터 브로커의 존재와 이들이 가진 데이터의 유통이 일정 부분 베일에 가려 있다는 점이다. 지난 2012년 페이스북과 데이터 브로커인 데이터로직스(Datalogix) 간의 협업 과정에서 프라이버스 침해 논란을 조사해야 한다는 주장이 나온 것도 같은 맥락이다. 이런 가운데 최근 정용찬 정보통신정책연구원 ICT 통계 분석센터장이 미국 공정거래위원회(FTC)의 실태 조사 보고서 등을 분석한 '빅데이터 산업과 데이터 브로커' 보고서를 내놨다. 

보고서를 보면 미국 내 데이터 브로커의 활동이 상세하게 나타나 있다. FTC는 액시엄과 데이터로직스를 비롯해 ID애널리틱스, 픽유 등 9개 데이터 브로커를 조사했다. 이들 9개 기업 모두 소비자로부터 직접 데이터를 수집하지 않았다. 인구통계 정보, 주소 변경 정보 같은 정부 데이터와 보도자료, 전화번호부, SNS 같은 공개 정보, 그리고 제품 구매 일자, 결제 방법 등 민간 데이터를 활용했다. 특히 다른 데이터 브로커와 정보를 공유했는데 조사한 9개 업체 중 8개 업체가 서로 데이터를 거래한 것으로 나타났다.

수집한 정보만으로는 상품이 되지 않는다. 이들은 고객의 요구에 따라 새로운 고객군을 추출해 판매했다. '사커맘(Soccer mom)'이 대표적이다. 자녀가 있고 최근 2년 내 스포츠용품을 구매한 21~45세 사이의 여성을 의미한다. 최근 1년 이내 캠핑 장비를 구매한 경험이 있는 사람을 추려 '캠핑 장비 구매 가능 고객'을 뽑아내거나, '부유한 베이비부머', '알러지로 고통받는 사람', '친구가 250명 이상인 트위터 사용자' 등도 별도로 판매했다. 

데이터 브로커의 주요 고객과 제공 서비스 유형 (표=미국 공정거래위원회)
데이터 브로커의 주요 고객과 제공 서비스 유형 (표=미국 공정거래위원회)
이들의 매출은 2012년 기준 4570억 원이다. 사커맘처럼 특정 고객군을 발굴하는 마케팅이 46%로 가장 많았고, 리스크 경감(42%), 사람찾기(12%) 순이었다. 리스크 경감은 은행 등이 고객 신원을 확인하거나 정부가 보조금 신청자의 정보 진위를 확인하는 것 등이다. 상품이 다양한 만큼 이들 데이터를 구매한 사람도 천차만별이다. 민간 영역뿐만 아니라 공공기관, 자선단체, 대학교 등 비영리 조직도 다수 이들 데이터를 구매한 것으로 드러났다.

데이터 브로커의 활동은 양면성을 갖고 있다. 잃어버린 신용카드를 제3자가 사용할 때 잡아내거나 기존의 광고 시스템에서 소외될 수 있는 중소기업의 제품을 필요한 사람에 전달하는 것 등이 대표적이다. 오랫동안 연락이 끊긴 지인을 찾는 것도 이들 기업이 제공하는 서비스의 또 다른 순기능이다. 그러나 정 센터장은 이 같은 데이터 브로커 시장에 대해 소비자가 데이터 수집에 대해 정확히 알지 못하는 것이 가장 큰 문제라고 지적했다. 

데이터 브로커가 자체적으로 방대한 데이터를 수집하는 것은 물론 그들 간에 데이터를 활발하게 거래하고 있지만 소비자 입장에서는 자신의 데이터가 어떤 경로로 수집, 유통되는지 알 수 없다. 정보를 서로 연결하면 출산, 질병, 정치적 성향 같은 민감한 정보도 추론할 수 있고, 특히 오토바이 마니아, 당뇨병 관심 고객군 등으로 분류되면 보험사에 의해 기피될 수도 있다. 이것이 자칫 잘못된 분석일 경우 이유도 모른채 불이익을 당할 수도 있다.

데이터 브로커의 소비자 데이터 수집 과정 (그림=정보통신정책연구원)
데이터 브로커의 소비자 데이터 수집 과정 (그림=정보통신정책연구원)
우리나라는 아직 데이터 브로커 산업이 활성화되지 않았다. 그러나 사회 전 분야에서 데이터 수집과 활용에 대한 요구가 커지고 있어 데이터 브로커를 둘러싼 미국의 논란은 시사하는 바가 있다. 정 센터장은 개인정보 보호를 위한 기술개발의 중요성을 강조했다. 미국은 매년 7700만 달러를 투입해 프라이버시 관련 기술을 개발하고 있고, 우리 정부도 '빅데이터 산업 발전 전략'에서 익명화 처리 등을 핵심 원천기술로 규정했다. 

현재 프라이버시에 대해서는 국가 간 기본적인 입장의 차이가 있다. 유럽은 기본 인권으로 보는 반면, 미국은 판매 가능한 상품이고 피해 여부에 따라 침해를 규정한다. 우리나라도 이에 대한 근본적인 논의가 필요하다는 지적이다. 정 센터장은 "기업보다 '정보 약자'인 소비자의 자기정보에 대한 권리 강화가 시급하다"며 "정보 유통에 대해 소비자의 신뢰를 받을 때 데이터 유통 활성화와 빅데이터 산업 발전도 가능하다"고 말했다.

박상훈 기자 nanugi@chosunbiz.com