[AI 365] "구글·네이버도 못한 '손고리즘 해방' 우리가 해내겠다"

입력 2019.08.17 06:00 | 수정 2019.08.18 16:51

[인터뷰] 김동환 포티투마루 대표, "유럽 B2B 검색 시장에 승부수"

‘스쿼드(SQuAD) 2.0’이라는 경진대회가 있다. 컴퓨터가 사람처럼 주어진 지문을 읽고 이해한 다음 정답을 찾는 ‘기계독해(MRC)’ 기술을 겨루는 대회다. 미국 스탠포드대학이 주최한다. 누구나 언제든 독자 알고리즘을 온라인에 올려 참여할 수 있다. 순위도 실시간으로 오른다. 실력을 공개 검증받는 자리이다보니 인공지능(AI) 분야에서 내로라하는 기업, 대학, 연구소가 앞다퉈 참여한다.

2018년 11월, 순위판 최상단에 구글과 함께 ‘포티투마루(42MARU)’라는 낯선 이름이 올랐다. 고작 2년차인 한국의 스타트업이다.

도대체 어떤 회사이기에 글로벌 기술거인과 어깨를 나란히 했을까. 서울 관악구에 있는 포티투마루 사무실을 찾아 그 비결을 들어봤다.

김동환 포티투마루 대표는 "MRC 기술 발전 방향을 내다본 덕분"이라고 말했다. 기술 발전 방향에 따라 문제 출제 경향이 달라지리라 예측했으며, 적중했다는 설명이다.

김동환 포티투마루(42MARU) 대표. / 김평화 기자
검색기술 역사의 산증인, MRC 기술을 내다봤다

"앞선 1.0 대회에서는 정답을 잘 찾는 게 중요했지만, 2.0 대회에서는 오답을 잘 찾는 게 중요할 것이라 예상했습니다."

김동환 대표는 전혀 다른 경합 방식을 예측한 게 주효했다고 강조했다. 앞선 대회에선 특정 지문을 주고 정답을 찾게 하는 전형적인 방식이었다. 반면 2.0 대회는 답이 없는 지문을 주고 알고리즘이 지문에 답이 없음을 찾아내는가를 평가 기준으로 삼았다.

김 대표는 "알고리즘은 무조건 답을 내려는 경향을 보이기에 답이 없다고 도출해내는 게 기술적으로 상당히 어려운 과제"라며 "2.0 대회에서 이런 기술을 요구할 것이라는 예감이 들었다"고 말했다.

예측 능력이 높은 또 다른 이유도 있었다. 창업 전에 쌓은 경력이다. 그는 엠파스, SK커뮤니케이션즈를 거쳐 오로지 검색기술에만 20년 넘게 몸담은 중견 개발자다. 벤처 붐이 일던 90년대 인터넷 초창기 시절부터 일하다 보니 검색기술의 역사와 발전 과정을 누구보다도 잘 알았다.

MRC 기술도 결국 알고리즘이 검색을 통해 얼마나 유효한 답에 접근하느냐가 핵심이다. 그렇다보니 김 대표의 경력이 도움이 됐다. 검색 기반 AI를 개발하는 포티투마루를 창업한 배경이기도 하다.

‘손고리즘’ 없는 검색기술 꿈꾼다

포티투마루는 MRC와 ‘말바꿔쓰기(Paraphrasing)’ 기술을 이용해 ‘Deep QA(Question Answering) 플랫폼’을 제공하는 스타트업이다. Deep QA란 딥러닝(Deep Learning) 기반의 AI를 검색기술에 도입해 하나의 분명한 답을 자동으로 찾는 기술을 말한다.

김동환 대표의 설명에 따르면 기존 검색은 정답을 바로 알려주기보다 정답에 해당하는 문서나 콘텐츠를 전부 제공하는 방식이다. 키워드 검색 기반인 탓이다. 해당 검색 키워드가 문서에 얼마나 들어가 있는지만을 살피는 식이다. 구글(Google) 검색도 예외는 아니다.

네이버나 다음은 구글보다 정보를 더 잘 선별하지만 한계는 여전하다는 설명이다. 하나의 정답을 목록화하는 시도는 있지만 초기 설정(세팅)을 사람이 해야 하기 때문이다. ‘A라는 질문에 B라고 답한다’는 알고리즘을 사람이 수없이 만들어내야 한다. ‘손고리즘’이라는 용어까지 나올 정도로 번거롭다.

김 대표는 "구글은 글로벌 서비스를 하다 보니 다양한 국가의 언어를 다룬다"면서 "여러 언어에서 모두 적용 가능한 자동 검색 알고리즘을 개발할 엄두를 내지 못하다 보니까 기초적인 검색 기능만 유지한다"고 말했다.

그는 이어 "네이버나 다음카카오가 구글보다 검색기술이 발달할지라도 기초 알고리즘 세팅을 사람에 맡기다 보니 서비스 확장에 한계가 있다"며 "손고리즘에 벗어나지 못해 우리나라 사업에만 집중해도 버겁다"고 지적했다.

포티투마루는 이같은 한계를 벗어나고자 ‘딥러닝’에 집중했다. 딥러닝은 AI가 대량의 데이터를 학습해 데이터 간 유의미한 패턴을 발견한다. 해당 패턴이 알고리즘 개발의 원천이 되는 식이다.

김 대표는 검색기술이 딥러닝을 적용하기 전과 후로 확 달라진다고 본다. 딥러닝으로 알고리즘을 자동화하면 검색기술에서 진일보할 수 있다는 설명이다.

포티투마루가 궁극적으로 지향한 기술 목표는 손고리즘에서 벗어나 검색 과정에서 생긴 시간과 비용 소모를 줄이는 일이다. 한 개의 분명한 정보만 제공해 검색자 편의를 높이는 식이다. AI가 딥러닝을 토대로 알고리즘을 초기부터 자동으로 구성하면 기술 개발자도 초기 세팅 때 드는 수고를 줄일 수 있다.

포티투마루(42MARU)의 ‘Deep QA(Question Answering)’ 기술 활용 분야. / 포티투마루 홈페이지 갈무리
"검색으로 인정받지 못한 설움이 창업으로 이어졌다"

"검색 기능은 궁금한 것을 바로 찾도록 돕기에 가장 이로운 인터넷 기능이라는 생각이 들었습니다."

검색기술 분야에만 종사한 이유가 뭐냐는 질문에 김 대표는 이렇게 답했다. 그는 20년 넘게 이 분야만 판 검색기술 장인(master)이다. 학부와 대학원까지 ‘컴퓨팅 비전(홍채나 지문 인식 기술의 기초)’을 전공한 후 엠파스에서 첫 사회생활을 시작했다.

병역특례로 엠파스에서 일하면서 검색기술 개발에 본격 뛰어들었다. 당시 벤처 붐이 일던 때다. 창립 초창기이다보니 검색기술 개발뿐 아니라 기획까지 다양한 업무를 맡았다.

엠파스를 인수한 SK커뮤니케이션즈에서도 마찬가지였다. 조직이 커진 후에도 검색기술 개발과 기획, 마케팅, 비즈니스까지 총괄했다. 업무 수행 능력을 인정받아 30대 중반에 검색사업본부장까지 올랐다. 검색기술 관련 전 부서를 총괄하는 중역 자리다.

남들보다 10년 빠른 승진이었지만 김동환 대표는 이내 회사를 박차고 나왔다. 그는 "대기업에 있다보니 골프를 치고 술도 마셔야 내가 승진하고 우리 조직도 지원을 받는 생활이 가치관과 맞지 않았다"라며 "인생의 의미를 못 느껴서 그만두고 나왔다"고 말했다.

검색으로 제대로 된 인정을 받지 못한 한(恨)도 있었다. 상도 받으며 나름 인정을 받았지만 콘텐츠 기반의 데이터가 워낙 부족하다 보니 검색 이용도에서 네이버를 이기지 못했다.

SK커뮤니케이션즈는 싸이월드 서비스를 제공했지만 개인 데이터이다보니 활용에 제약이 있었다. 그 사이 네이버는 지식인이나 블로그, 카페 등 다양한 서비스를 제공하며 데이터와 콘텐츠를 쉽게 모아 검색 기능에서 선두를 차지했다.

김 대표는 "사업 잘하는 저 동네(네이버 등)가 사람을 잘 모아 기술보다 손으로 성공하는 것을 보니 스타트업으로 새로 검색 사업에 뛰어들기가 어려웠다"며 "은퇴 후 우연히 딥러닝 기술을 접하면서 검색에 딥러닝을 접목하면 해볼 만할 싸움이라 생각해 뛰어들었다"고 말했다.

IT조선 기자와 인터뷰를 진행하는 김동환 대표의 모습. / 김평화 기자
이동통신업부터 조선업까지... 다양한 기술 활용 분야

포티투마루는 Deep QA 기술을 다양한 산업 분야에 녹이려고 노력한다. 기업용 인트라넷이나 챗봇, 스마트 스피커 등에 쓰일 수 있다는 게 회사의 설명이다. LG유플러스의 어린이 스마트워치(smart watch)인 ‘키즈 워치’에 포티투마루의 기술이 도입됐다.

KT도 AI 플랫폼 ‘기가지니(GiGA Genie)’에 이 회사 기술을 탑재했다. 사용자가 지식성 질문을 하면 Deep QA를 통해 하나의 답을 제시하는 방식이다. 음성 기반의 문답 시스템이다보니 검색 포털처럼 여러 정보를 나열할 수 없다.

최근 대우조선해양과도 협업했다. 기업 내부 데이터가 방대하다보니 검색을 통해 업무를 처리하기가 힘들었다. 종전에는 특정 키워드를 검색하면 여러 개 목록이 나왔다. 이제 Deep QA를 도입, 특정 정답만 제시해 업무 시간을 획기적으로 단축했다.

유럽 심장으로 향하는 포티투마루의 도전

포티투마루는 2017년 네이버 계열 벤처캐피탈(VC)인 스프링캠프로부터, 2018년에는 유럽의 유명 액셀러레이터인 테크스타즈(techstars)로부터 투자를 받았다. 올해 말께 시리즈A 라운드 투자 유치도 추진한다. 국내에서는 해당 규모로 투자를 유치한 선례가 없지만 높은 기술력을 토대로 성과를 내겠다는 목표다.

김동환 대표는 우리나라에 기술 거점을 두면서 유럽 시장에 진출하겠다는 구상을 밝혔다. 한국에서 원천 기술을 개발하고자 해외 현지 개발 인력도 본사로 불러들였다.

유럽에서는 클라우드 기반 ‘서비스형 소프트웨어(SaaS)’ 모델로 검색기술을 B2B(Business to Business) 시장에 제공할 계획이다. SaaS는 사용자가 소프트웨어를 이용한 만큼 그 비용을 제조사에 지불하는 방식이다.

김동환 대표는 "비즈니스 시장으로 해외, 그중에서도 유럽을 선택한 이유는 미국보다 AI 토양이 좋기 때문"이라고 답했다. 실리콘밸리에서 애플리케이션을 개발해 상용화에 능한 미국과 달리 유럽은 원천 기술력이 강하다.

특히 영국은 정부와 민간 모두에서 AI 분야에 집중한다. 영국 정부는 그간 꾸준히 AI 기술에 투자했다. 영국 옥스퍼드대학교에서도 유의미한 AI 연구가 이어진다. 알파고(AlphaGo)를 개발한 딥마인드(Deep Mind)의 모태도 영국이다.

SaaS가 안착한 상태인 것도 유럽을 택한 이유다. SaaS로 시스템을 구축하면 현지 지사 건물을 두지 않더라도 원격 서비스를 제공할 수 있다. 최소 인력으로 회사를 운영한다는 이점도 있다.

포티투마루는 3월 영국에 법인을 설립해 본격적인 시장 공략을 앞뒀다.
2018년 7월 유럽 액셀러레이터 테크스타즈(Techstars) 런던 프로그램에 선정돼 발표하는 김동환 대표. / 유튜브 홈페이지
‘시니어 스타트업’ 사명감도 남달라

포티투마루는 Deep QA 기술로 유럽에 진출해 B2B 시장에서 유니콘(기업가치 1조원 이상 스타트업)이 되는 것이 꿈이다. 검색기술 생태계에 구글과 같이 영어권 B2C(Business to Customer) 시장을 선점한 기업은 많다. 새 블루 오션인 유럽 기반의 B2B 시장을 노려보자는 목적이다.

물론 쉽지 않은 도전이다. 유럽은 영어권과 달리 나라마다 언어가 다르다. 검색 알고리즘 개발에 상당한 기술력이 요구된다. 언어마다 문법 기초를 파악한 후 알고리즘을 새롭게 개발해야 해 인력과 비용 소모가 크다.

김동환 대표는 이 어려움을 뛰어넘을 수 있다고 자신했다. 그는 "학습 데이터만 잘 구축하면 딥러닝을 토대로 AI가 알아서 새 언어를 익힐 수 있다"며 "유럽권에서 해당 기술 도입이 가능한 상태"라고 말했다.

늦깎이 스타트업의 성공 사례를 만들어 보고픈 욕심도 있다. 그는 "나뿐만 아니라 우리 회사 개발자 다수가 40대인 시니어 스타트업으로서의 사명도 느낀다"라고 말했다. 그러면 회사명에 있는 숫자 ‘42’는 임직원 평균나이인가. 그건 아니었다. 영국 작가 더글러스 애덤스의 SF 소설인 ‘은하수를 여행하는 히치하이커를 위한 안내서(The Hichhiker’s Guide to the Galaxy)’에서 따왔다.

소설 속 슈퍼컴퓨터는 ‘삶, 우주 그리고 모든 것에 대한 궁극적인 질문’에 오랜 계산 후 42라고 답한다. 하필 왜 ‘42’인지 아직도 밝혀지지 않았지만 김 대표와 같은 많은 프로그래머에게는 의미 있는 숫자다. 소설 속 슈퍼컴퓨터 이름도 ‘딥소트(Deep Thought)’다. 딥러닝과 맥락이 닿았다.

김 대표는 "포티투마루가 유니콘이 되면 좋겠지만 그렇지 않더라도 우리가 도전한 경험이 뒤따르는 젊은 스타트업에 좋은 양분이 된다면 가치 있는 도전이라고 생각한다"고 덧붙였다.


키워드