딥핑소스, 개인정보 노출 막은 AI서비스 개발

송주상 기자
입력 2020.10.29 06:00
개인정보 걱정 없이 인공지능(AI) 서비스를 누릴 수 있는 기술이 등장했다. AI 기술 고도화와 함께 개인정보 보호가 중요한 화두로 떠오른 상황이어서 시장 반응이 주목된다.

김태훈 딥핑소스 대표는 28일 IT조선과의 인터뷰에서 "많은 개인정보가 AI학습 등을 위해 불법적으로 거래되고 있다"며 이 문제를 비식별화로 해결했다고 밝혔다.

딥핑소스에 따르면, 보안 카메라 영상이나 셀프 카메라 등 영상과 이미지가 가장 심각하고, 채팅이나 이메일과 같은 텍스트, 녹음 등 오디오, 심지어 위치 기록 등도 불법 거래되고 있다.

김태훈 딥핑소스 대표. /IT조선
이에 북미, 유럽 정부는 강력한 개인정보보호법을 도입했다. 오히려 다수 업체가 자유롭게 AI서비스 개발이나 도입에 나서지 못하고 있다.

특히 유럽은 여러 카메라가 동일한 객체(오브젝트)인지 확인하는 과정도 개인 정보 침해로 판단할 정도다. 유럽의 한 건설회사는 세이프카메라를 실시간으로 확인할 수 없어, 세이프카메라 도입을 주저하고 있다.

연구진들도 비슷한 상황이다. 국내외 모두 연구용으로 데이터 활용은 자유롭지만, 상용화 AI서비스는 엄격하다. 각 데이터에 관해 개인의 동의가 하나하나 필요하고, 데이터 제공자가 원한다면 언제라도 학습 데이터를 삭제해야 한다. 안정적인 AI서비스를 내놓기 쉽지 않다.

딥핑소스는 이런 문제를 해결할 수 있는 비식별 서비스를 제공한다. 김태훈 대표는 "기본적으로 데이터를 단어 뜻 그대로 ‘부순다’. 원본 데이터 중 목적에 맞는 것만 남긴다. 예를 들어 시선처리를 위한 AI를 개발하고 있다면, 시선 처리와 관계된 데이터만 남기는 방식"며 "목적에 맞게 사용하도록 돕는 기술"라고 소개했다.

비식별 기술은 AI프로젝트 가장 앞단에 위치한다. 학습 데이터 확보를 위해 원본 데이터를 수집하는 단계에서 데이터를 비식별화한다. 영상, 이미지뿐만 아니라 오디오, 텍스트 등 데이터도 비식별화 할 수 있다.

기존 개발자들이 별도로 수행할 부분도 없다. 김 대표는 "익명화 단계를 거친 뒤에는 기존 AI프로젝트와 방법이 같다"며 "코드 수정이 단 한 줄도 필요 없다"라고 말했다. 실제 같은 AI모델에서 각 원본데이터와 디핑소스의 비식별데이터로 학습한 AI의 정확도 차이는 1% 미만이다.

서비스를 시연 중인 김태훈 대표. 오른쪽이 비식별화된 사진이다. AI도 사람도 개인을 특정하기 힘들다. /IT조선
또한 10~20달러 정도의 칩이면 연산할 수 있어, 하드웨어적인 부담도 없다. 비식별화 과정 자체도 실시간으로 진행된다.

무엇보다 한번 비식별화된 데이터는 원본으로 돌아갈 수 없어 안전하다. 김 대표는 "원본 데이터로 못 돌아가는 ‘비가역성’이 핵심"라고 밝혔다. 개발자도, 딥핑소스도, 심지어 데이터 제공자도 원본 데이터를 알 길이 없는 것이다.

기존 프로젝트에 큰 변화가 필요 없는 특징 덕에 이미 인텔 등 국내외 유명 IT기업이 딥핑소스의 솔루션을 사용하고 있다. 특히 개인정보보호법이 상대적으로 엄격한 해외 시장에서 큰 관심을 받고 있다.

김태훈 대표는 "해외 진출 속도가 코로나19로 늦어졌지만, 내년에는 본격적으로 진출할 계획이다. 독일 보쉬 등 카메라 납품 업체와 파트너를 통해 해당 모델에 솔루션으로 들어가는 것이 큰 목표다"라고 포부를 밝혔다.

송주상 기자 sjs@chosunbiz.com




T조선 뉴스레터 를 받아보세요! - 구독신청하기
매일 IT조선 뉴스를 받아보세요 닫기