[인터뷰] 프론테오 "인공지능 엔진 키빗, IBM 왓슨보다 실용적이다"

입력 2018.11.06 06:00 | 수정 2018.11.06 17:24

전자 디스커버리 혹은 e-디스커버리(Electronic discovery·e-discovery)로 불리는 ‘전자적 증거개시’는 민사소송에서 증거로 활용할 수 있는 전자 저장 정보를 제출해야 하는 제도를 의미한다. 여기서의 전자 저장 정보는 전자매체(PC, 서버, 휴대전화, PDA, 휴대 정보단말기, USB 메모리 등을 활용한 외부기억장치, 뮤직 플레이어, 클라우드 시스템 등)에 기록된 정보다.

히데키 다케다 프론테오 최고기술책임자. / 프론테오 제공
전자 정보는 형태가 없지만 지속성을 가지고 있다는 점에서 종이에 기록된 정보와 다른 성질을 지니는 것으로 인정받는다. 또 종이 정보에서 찾기 힘든 메타 데이터를 포함한다. 때문에 최근 법조계에서 e-디스커버리는 활용도가 높은 증거로 활용된다.

e-디스커버리 활용이 가장 활발한 곳은 미국이다. 이미 2006년부터 별도 법령으로 e-디스커버리를 제도화했다. 그리고 우리에게 e-디스커버리의 중요성을 일깨워준 대표적인 소송이 바로 ‘삼성-애플의 특허 소송전’이다.

프론테오는 e-디스커버리 분야에서 많은 관심을 받는 회사다. 자체개발한 인공지능 엔진 ‘키빗(KIBIT)’을 통해 전자 저장 정보 안에서 수많은 리스크와 찬스를 찾아내고, 의뢰인에게 최적의 솔루션을 제공한다. 최근 ‘키빗’은 영역을 넓혀 비즈니스 솔루션이나 헬스케어에서도 활용되고 있다.

IT조선과 단독으로 만난 히데키 다케다 프론테오 최고기술책임자(CTO)는 빅데이터를 분류하고, 분석해 최적의 솔루션을 제시하는 인공지능 엔진 키빗을 만든 사람이다. 그는 "나는 원래 자연어(NLP)를 활용한 애플리케이션을 15년 이상 만들어 왔지만 프론테오에서 처음 맡은 일은 회사의 전신인 유빅(UBIC)이 주력해온 e-디스커버리 시스템을 개선하는 것이었다"며 "그러다 회사에서 미래 인공지능을 활용한 e-디스커버리 분야가 주목받을 것이라고 얘기했고, 이에 따라 자연어 처리 인공지능 엔진 키빗을 개발하게 됐다"고 말했다.

프론테오 키빗의 시스템은 인공지능을 이용한다는 점에서 IBM의 왓슨과 유사성을 지닌다. 이와 관련 다케다 CTO는 "왓슨은 지금까지 능력을 보여준 분야 외에 비즈니스 솔루션 영역에서도 두각을 나타낼 것이라고 생각했으나, 실제로는 그렇지 않았다"며 "애초에 왓슨은 워낙 유명한 인공지능이어서 우리와 직접 비교할 수는 없지만 키빗은 활용도가 높은 개별 패키지화 해서 실적을 쌓아왔다"고 전했다.

키빗은 텍스트 빅데이터를 수집하고, 분석하며, 분류하는 인공지능 엔진이다. / 프론테오 홈페이지 갈무리
이어 그는 "키빗의 특징은 비교적 적은 정보로도 정밀도를 향상시킬 수 있는 실용적인 엔진"이라며 "키빗에 학습을 시킬 때 가능한 넓은 범위에서 특성을 찾을 수 있도록 하는데, 발견해야 하는 데이터와 발견하지 않아도 되는 데이터의 차이를 구분할 수 있도록 하기 위해서다"고 말했다. 여기에 반복 학습으로 정밀도를 높이고, 정보 누락 방지를 위해 학습의 질을 높이는 방법을 택한다.

가령 회사에서 신입사원을 뽑을 때, 키빗을 활용하면 회사의 비전과 인재상에 적합한 직원을 찾을 수 있다. 회사에서 능력을 발휘하는 직원의 입사 데이터를 활용하는 것이다. 많은 케이스를 분석해서 현재의 신입사원의 정보와 대조해, 앞으로 일을 잘할 것 같은 직원을 예측한다. 100% 맞지 않을 수도 있지만 회사는 인재 채용의 실수 확률을 줄일 수 있다는 게 히데키 다케다 CTO의 설명이다.

반대로 회사 내부의 부정에 대해서도 조사가 가능하다. 부정행위가 발생 했을 때 전자 정보를 분석해 실제로 그 증거를 찾아내는 것이다. 또 정부 기관에서는 조세 관련 범죄의 증거를 찾을 수 있다. 예를 들어 압수수색으로 확보된 수많은 전자 정보 중에서 탈세 행위와 관련된 증거들을 빠르게 찾아낼 수 있는 능력을 지녔다.

히데키 다케다 CTO는 "디지털화된 정보만 있다면 뭐든 솔루션을 제시할 수 있다"며 "결국 방대한 자료를 취합해서 분석하고, 분류해 최적의 자료를 찾아내는 것이 키빗이 가진 능력이기 때문"이라고 말했다. 이어 "고객 만족도 부분이나, 보험사기 방지, 탈세, 건강보험 등에서도 활용도가 높다"고 덧붙였다.

앞으로 키빗의 과제는 텍스트 정보 뿐 아니라 숫자, 음성, 영상 등 다른 데이터에서도 동일한 분석 솔루션을 제공하는 것이다. 이 과정에서 각 언어의 차이점을 잘 파악하기 위한 업그레이드 역시 이뤄져야 한다. 그리고 높은 정확도와 학습 자동화에도 역량을 쏟을 방침이다.

최근 경기도 판교에서 열린 2018 4차산업혁명 심포지엄에 참여한 프론테오. / 프론테오 제공
마지막으로 한국 시장에 대해 히데키 다케다 CTO는 "한국 기업의 경우 e-디스커버리 제도를 가진 국가에 진출할 때 키빗을 통해 중요한 솔루션을 제공받을 수 있고, 내부 조직관리도 가능하다"며 "한국은 지금도 중요한 고객이 많고, 앞으로도 중요한 시장이라는 것은 틀림없는 사실"이라고 전했다.


키워드