노성운 AI스튜디오 대표, 플랫폼 ‘마이크라우드’ 도전
AI 기반 베이커리 서비스 ‘앙꼬’서 배운 노하우 담아
"데이터라벨링 가장 존중 ··· 생명과 직결된 부분"

인공지능(AI)에 제일 중요한 것은 무엇일까? 바로 ‘데이터’다. 노성운 AI스튜디오 대표는 데이터를 빵(Bread)에서 '제대로' 배웠다고 말했다.

노 대표는 데이터 산업에만 20년 몸담은 베테랑이다. 2001년 테스트 전문 업체 인피닉을 창업한 그는 2019년부터 AI스튜디오에 집중하고 있다. 노 대표는 "AI스튜디오가 인피닉보다 가치가 커질 수도 있다"며 데이터산업에 대한 기대감을 드러냈다.

20년차 베테랑 노성운 AI스튜디오 대표는 ‘지금도 배운다’고 말한다. /IT조선
20년차 베테랑 노성운 AI스튜디오 대표는 ‘지금도 배운다’고 말한다. /IT조선
최근 AI스튜디오는 데이터라벨링을 위한 플랫폼 ‘마이크라우드를 론칭했다. 마이크라우드는 데이터라벨링(AI에 필요한 데이터를 수집·분류·가공하는 작업) 플랫폼이다. 매직핀과 같은 기능을 통해 누구나 쉽게 사용할 수 있어 라벨링을 통한 용돈벌이는 물론, 전문가로 거듭날 수도 있다. 직접 데이터 작업하기 원하는 기업은 AI스튜디오의 솔루션을 사용할 수 있다.

제공되는 솔루션은 현재 인피닉과 AI스튜디오에서 학습데이터를 만드는 팀이 사용하는 도구와 동일하다. 노 대표의 20년간 노하우가 담긴 셈이다.

특히 ‘앙꼬’를 준비하며 AI에게 좋은 데이터가 무엇인지 몸으로 겪었다. 노성운 대표는 AI스튜디오에 인공지능 연구팀이 있음을 소개하며 "AI를 직접 만들어봐야 데이터가 어떻게 만들어져야 하는지 알 수 있다"라고 강조했다.

"빵 5만장 보면서 좋은 데이터 조건 배웠죠"

앙꼬는 올해 AI스튜디오가 직접 개발한 베이커리 전용 무인 키오스크다. 올해 9월 상용화를 앞둔 단계로 사람없이 빵을 이해하는 AI기반 이미지 인식 기술이 담겼다. 처음부터 끝까지 AI스튜디오가 개발했다.

노성운 대표는 "AI스튜디오 기술이 빵에서 시작했다고 해도 과언이 아니다"며 "많은 AI가 서비스 실체가 없다. 소프트웨어와 하드웨어를 포함한 풀 패키징 서비스를 해보지 않아서는 진정한 AI를 안다고 할 수 없을 것"라고 지적했다.

고작 빵이라고 생각하기 쉽다. 하지만 AI 이미지 인식 부문에서는 까다로운 문제다. 빵의 종류 자체도 많고, 제빵사에 따라 외형이 다를 수 있다. 경우에 따라 비닐 포장이 되어 있기도 하고, 새로운 종류의 빵은 한 달에 5종 정도 나온다. 초기에는 각 빵에 대해서 잘 학습하기 위해서 5만여장의 사진이 필요했고, 현실적으로 새로운 빵 학습은 불가능했다.

좋은 학습 데이터가 중요했다. 노성운 대표는 "AI가 꽈배기 2개를 계속 하나로 인식하는 문제가 있었다. 학습 데이터는 모두 꽈배기 1개여서 아리송했다. 알고 보니 꽈배기를 하나만 사는 고객이 없어 그랬던 것"라며 "직접 서비스하지 않았으면 몰랐을 부분"라고 전했다.

이어 그는 "몇 개 잘못된 데이터가 AI를 헷갈리게 한다. 새로 학습하거나 수백 배 데이터가 필요하다"며 "그만큼 학습 데이터가 중요하다"라고 강조했다.

현재 포스뱅크와 협력하여 완성된 앙꼬는 결제 시스템도 포함됐고, 기술적으로도 진일보했다. 신규 빵 등록에 필요 사진 수는 기존 수만장에서 수십장으로 줄었다. 인식률도 100%에 가깝다. 작년 여름 인식률은 90%. 10% 올리는 데 1년이 걸렸다.

"바닐라 빵만 인식 안된다고 생각해보자. 하필 그날 빵집에서 바닐라 빵만 팔릴 수 있다. 얼마나 많은 빵이 인식되는지는 중요치 않고, 사용자 입장에서는 답답할 것이다"라며 운을 뗀 노성운 대표는 "100%가 목표인 이유"라고 밝혔다.

AI스튜디오 데이터 노하우와 철학 담긴 플랫폼 ‘마이크라우드’

AI스튜디오 기술적 노하우와 데이터에 관한 철학은 최근 론칭한 플랫폼 마이크라우드에 담겼다. 중심에는 매직핀이 있다. 클릭 몇 번으로 물체를 인식하고 여백이 거의 없는 좋은 품질의 이미지를 빠르게 얻을 수 있다. 반복 작업에 가까운 데이터라벨링에 대한 피로도도 낮췄다.

 마이크라우드는 플랫폼이다. 데이터라벨링 툴을 제공하고 생태계를 이끈다. /AI스튜디오
마이크라우드는 플랫폼이다. 데이터라벨링 툴을 제공하고 생태계를 이끈다. /AI스튜디오
마이크라우드는 웹에서 작동한다. 웹에서 클라우드 형태로 작업물을 자동으로 모은다. 여러명이 함께 라벨링 작업을 한 뒤, 다시 한번 정리하는 수고로움이 필요 없다. 이미 많은 대기업이 쉽고 간편한 AI스튜디오 툴을 사용하고 있다.

단순히 편리한 것이 끝이 아니다. AI 학습 데이터 구축 시간 80%이상이 데이터라벨링 단계임을 고려하면, AI개발 소요 시간도 단축하는 효과도 있다.

노성운 대표는 "PC만 사용할 줄 알면, 누구나 마이크라우드로 데이터라벨링 할 수 있다"며 "일부는 경험을 쌓아 자율주행처럼 복잡한 조건이 필요한 데이터도 해결하는 전문 '라벨러'가 될 수 있다"라고 설명했다.

언젠간 모든 데이터에 라벨이 붙어, 마이크라우드가 필요 없지 않을까?

물음에 노성운 대표는 고개를 저었다. 노 대표는 "AI마다 다른 데이터가 필요하다. 같은 이미지라도 다른 라벨링이 필요하다"며 "AI가 고도화되면 오히려 마이크라우드가 더 편리하게 느껴질 것"라고 답했다.

예를 들어 사과를 인식하더라도 요리 관련 AI는 과일로 인식하지만, 로봇 청소기 AI에겐 단순 장애물일 뿐이다. 각 경우는 다른 라벨링이 필요하다.

노성운 대표는 "데이터라벨링이 단순 작업처럼 보일 수도 있지만, 나에겐 가장 존중하는 과정"라며 자율주행 AI를 예시로 들었다. 자율주행 AI는 학습 데이터에 따라 급박한 상황을 판단하게 된다. 잘못 학습한 AI는 생명을 위험에 빠뜨릴 수도 있다.

이어 그는 "AI는 생명과 사회와 직결된 부분"라고 강조했다. 노 대표와 AI스튜디오가 데이터에 관한 양보없는 뚝심과 존중을 마이크라우드에 담은 이유다.

송주상 기자 sjs@chosunbiz.com


관련기사