오승택 에이모 대표 "AI학습 데이터, 가격만큼이나 가치·효율 따져야"
센서퓨전 데이터 전문가가 지원하고, 에이모 엔터프라이즈서 라벨링
"데이터 퍼스트 추구··· 플랫폼 고도화·인재 육성 이어간다"

교육은 백년대계(百年大計)다. 인공지능(AI)도 다르지 않다. AI 프로젝트의 성패가 기획이나 서비스보다 좋은 학습에 달렸다는 말은 과언이 아니다. 그리고 AI학습은 데이터에 이름을 붙여주는 ‘라벨링’ 품질이 좌우한다.

디지털 뉴딜과 언택트 산업의 약진으로, 많은 기업이 고품질 AI 학습 데이터 확보에 나섰다. 오승택 에이모 대표는 "일부 데이터 라벨링 수행기업이 낮은 가격만을 내세웠지만, 결국 고(高)가치가 고효율로 이어지는 기업을 찾아야 한다"라고 조언했다. 좋은 AI를 위해선 단순 가격보다는 노하우와 플랫폼을 고려하라는 설명이다.

 “지속가능한 AI개발 위해서는 노하우 중요하다” 오승택 에이모 대표. /IT조선
“지속가능한 AI개발 위해서는 노하우 중요하다” 오승택 에이모 대표. /IT조선
에이모는 2016년 설립해 업계 선발 주자로 나섰다. 이미 누적 1억건 이상의 AI학습용 데이터를 제공했고, SKT, 네이버, 현대자동차와 협업하며 대형 프로젝트를 진행했다.

특히 AI 학습 데이터 중 가장 까다롭다고 알려진 자율 주행에 강점이 있다. 오승택 대표는 "(2년 전부터) 판교 제로시티에 입주하며 자율 주행 데이터 구축 경험이 쌓이기 시작했다"라고 말했다. 제로시티는 2015년부터 일반 차량과 자율주행 테스트 차량이 같은 도로를 쓰는 ‘자율주행의 첨병’이라 불리는 곳이다.

이어 그는 "자율주행은 데이터 라벨링 규칙이 많아 작업자 사이의 커뮤니케이션도 자주 벌어진다. 슬랙과 같은 협업 플랫폼이 필요했다"라고 설명했다. 자연스럽게 에이모는 작업 공간을 구축했고, 데이터 라벨링 플랫폼 에이모 엔터프라이즈의 뿌리가 됐다.

센서퓨전 데이터도 거뜬, 노하우 담은 ‘에이모 엔터프라이즈’

자율주행 차량에 포함되는 AI는 생명과 직결됐다. AI가 학습한 조건에 따라 도로를 주행하고, 위험을 회피한다. 그만큼 어떤 데이터로 학습하는지 중요하다. 하지만 데이터라벨링 난이도는 최고 수준이다. 특히, 센서퓨전(Sensor Fusion)때문이다.

센서 퓨전은 여러개 센서를 하나로 합치는 방식이다. 인간의 운전을 대신하는 AI는 카메라, 라이다(LIDAR), 레이더(RADAR) 등 다양한 센서를 활용한다. 각 센서에서 얻은 데이터를 따로 활용하지 않고, 합쳐서 센서퓨전 데이터로 통합해 사용한다. 오탐률을 최소화하기 위함이다.

 에이모 엔터프라이즈는 자율주행은 물론 일반 AI프로젝트도 슬랙처럼 진행할 수 있다. /에이모
에이모 엔터프라이즈는 자율주행은 물론 일반 AI프로젝트도 슬랙처럼 진행할 수 있다. /에이모
오승택 대표는 "센서퓨전 데이터는 주행 영상과 라이다 등을 정합할 필요가 있다. 이 때, 리콜(재현율, 실제 참을 참으로 예측한 비율)을 중심으로 진행된다. 점 하나하나가 중요한 포인트 클라우드 타입 데이터는 사람이 눈으로 판단하기 어려울 수 있다"며 "AI 어시스트 기능을 통해 라벨러 작업을 돕는다"라고 설명했다.

에이모 엔터프라이즈의 AI는 자율주행은 물론 기존 작업에 30%이상의 효율을 끌어올린다.

여기에 센서퓨전 데이터 전문가도 다수 포진해 자율주행과 같은 난이도 높은 프로젝트를 지원한다. 에이모의 전문가가 주행영상과 라이다를 프레임 단위로 연결해 일반 라벨로도 작업할 수 있는 형태로 제공한다.

그는 "에이모 엔터프라이즈는 에이모가 지금까지 경험한 데이터 구축 사례를 바탕으로 제작한 플랫폼이다. 또 누구나 편하게 사용할 수 있는 웹 기반"며 "꾸준히 자율 주행 프로젝트를 진행한 덕에 북미 시장에서도 성과가 나오고 있다"라고 덧붙였다.

"언제나 데이터 퍼스트 … 엔터프라이즈, 모든 데이터 형태 다룰 것"

전문성을 내세운 에이모는 전문 데이터 라벨러에 대한 대우도 확실하다. 기본적으로 라벨러는 재택근무를 지원하고, 뛰어난 인재는 장기 계약을 진행한다. 실제로 정규 사원으로 채용하며 데이터 라벨링 플랫폼 선순환을 이끌었다.

오승택 대표는 "AI 학습 데이터 구축을 위한 기능은 에이모 엔터프라이즈에 모두 포함됐다"며 "중요한 것은 프로젝트 설계다. (까다로운 프로젝트일수록) 잠깐 배워서 할 수 있는 데이터 구축은 한계가 있다"라고 적극적인 인재 채용 정책을 설명했다.

이는 에이모의 데이터 퍼스트 정책의 일환이다. 에이모 엔터프라이즈에는 AI어시스트를 비롯하여 자동 검수 과정, 라벨링 지원 등 다양한 기능이 포함됐다.

하지만 좋은 AI를 위해 필요한 순도 높은 데이터는 결국 사람 손을 거치기 때문이다. 오승택 대표는 "AI업계에 다량의 순도 높은 데이터가 많지 않다. 믿을 수 있는 데이터를 내놓기 위한 과정"라고 설명했다.

약 3개월간의 테스트를 진행하며 예열 과정을 마친 에이모 엔터프라이즈는 본격적으로 시장에 나선다. 이미 다수 해외 연구소와 스타트업들 이용하며 피드백을 주고 받았고 10월 중 정식 론칭 예정이다. 최근 큰 관심을 끌고 있는 의료 데이터를 위한 도구도 추가할 예정이다.

오 대표는 "사용할 수 있는 툴 템플릿이 많을수록 (데이터와 유저 모두에게) 흡수성이 좋은 플랫폼이다"며 "데이터 라벨링 플랫폼의 시작은 다루지 못하는 데이터가 없는 것"라고 강조했다.

송주상 기자 sjs@chosunbiz.com


관련기사