[AI는 일자리다] 데이터라벨링, 범국민 AI네이티브 '초석'

송주상 기자
입력 2020.11.04 06:52 수정 2020.11.04 08:14
'2만 데이터라벨러 양성' AI데이터 산업은 일자리 보고(寶庫) (상)

‘인공지능(AI)이 일자리를 모두 빼앗을까?’ AI도입으로 일자리가 사라지는 사례가 나타나며 우려가 이어지고 있다. 하지만 AI 도입에 소극적인 태도는 안 된다. 이미 글로벌 트렌드다. AI강국을 이끄는 '산업 사다리'를 자처한 AI학습용데이터 구축 사업을 3회에 걸쳐 살펴본다.

인공지능(AI)학습용데이터 구축 사업이 ‘크라우드소싱’으로 진입장벽을 낮춰 AI산업계를 이끌 'AI네이티브(AI를 원어민처럼 자유롭게 사용하는 계층)' 양성 환경 조성을 이끈다. 누구나 AI모델 개발보다 쉽고 간단한 데이터라벨링으로 AI프로젝트 참여를 할 수 있어 눈길을 끈다.

AI프로젝트는 높은 난이도와 달리, 시작은 상대적으로 간단한 데이터라벨링에서 시작한다. 데이터라벨링은 실제 현실에 있는 물체에 AI가 이해할 수 있는 이름을 붙여주는 과정이다. 실제 작업자인 ‘데이터라벨러’는 사진에서 사람과 차량을 구분하고 선택하는 등 ‘AI를 위한 선생님’인 셈이다.

하지만 데이터라벨러가 고품질 AI학습용 데이터를 내놓기 위해서는 AI프로젝트에 대한 높은 이해도가 필수적이다. AI가 원하는 형태로 전달해야 좋은 AI모델이 완성되기 때문이다. 특히 데이터가공업체 입장에서는 데이터 검수 과정이 줄어들어, 별도 과정으로 작업자의 AI교육에 나서고 있다.

AI학습용데이터 구축 사업은 국민 누구나 제한 없이 데이터라벨링이라는 AI프로젝트에 참여할 수 있어, 모두가 AI네이티브로 거듭날 수 있는 초석이다.

장소·시간 자유로운 ‘크라우드 소싱’ ... 경단녀, 장애인 등 누구나 부담 없이 참여

크라우드소싱은 기업활동에 대중(크라우드) 또는 소비자가 참여하고 수익을 공유하는 근무 형태다. 초기 AI 데이터 시장을 선도한 아마존메커니컬터크(Amazon Mechanical Turk)가 데이터 처리를 위해 크라우드소싱을 도입했고, 현재는 190개국에서 50만에 이르는 작업자를 보유하고 있다.

AI학습용데이터 구축 사업은 크라우드소싱으로 참여 진입장벽을 낮췄다. /아이클릭아트
이번 AI학습용데이터 구축 사업은 크라우드소싱 방식으로 2만개 이상의 일자리 확보에 나섰다. 데이터라벨링 작업은 ‘오브젝트’, ‘어노테이션’ 등 전문용어를 이해하지 못해도 직관적으로 따라 할 수 있어 진입장벽이 낮은 편이다. 여기에 근무 장소 및 시간이 자유로운 크라우드 소싱으로 한층 더 부담 없는 일자리로 거듭났다.

데이터가공업체도 별도 교육으로 IT지식이 부족한 작업자를 지원하며, 이미지나 영상과 관련된 라벨링 작업은 마우스만으로 수행할 수 있다. 대부분의 경우, 데이터라벨링은 하루 할당량 등 의무적으로 배정된 작업량도 없다.

출퇴근이 쉽지 않은 장애인이나, 재취업이 쉽지 않은 경력단절 여성, 자투리 시간 활용을 원하는 취업준비생 등도 부담없이 데이터라벨링에 참여할 수 있다. 특히 IT지식이 충분한 작업자에게는 출퇴근하며 돈을 버는 고수익 아르바이트이기도 하다.

한 데이터가공업체 관계자는 "일반적인 근무시간인 ‘나인투식스(오전9시부터 오후6시)’보다 그 외 시간에 데이터라벨링하는 작업자 수가 많다"며 "작업량도 비슷한 상황"라고 밝혔다. 해당 업체는 IT업무에 익숙한 근로자가 이른바 엔잡러로서 참여한 것이라고 분석했다.

업체는 고품질 데이터를 가공하는 작업자를 따로 관리하며 ‘모시기’에 한창이다. 최근에는 단가가 높은 고난도 AI프로젝트를 능숙한 작업자에게 맡기기도 했다. 일부 데이터가공업체는 AI프로젝트 이해도가 높은 작업자를 정규직으로 채용했다.

‘AI 맛본다’ AI학습용데이터 구축 사업은 AI전문가 키우는 사다리

전 세계적으로 AI수요는 계속해서 커지고 있다. 시장조사업체 IDC는 글로벌 AI 관련 비용을 2020년 501억달러(약59조원)에서 2024년에는 1100억달러(약130조원) 규모로 전망했다. 시장 크기가 4년 만에 2배 이상 증가하는 것이다.

이에 고품질 AI학습용데이터에 대한 필요성과 함께, 전문 데이터라벨러 수요도 계속해서 커지고 있다. 고품질 데이터는 작업자의 높은 AI 이해도가 필수적인 만큼, 좋은 성과를 보인 작업자는 기존 이상의 역할을 수행한다.

데이터라벨링은 전 국민이 부담 없이 AI프로젝트에 참여할 수 있는 기회다. /아이클릭아트
출산과 육아로 경력 단절을 경험한 주부 B씨는 3년 만에 데이터 매니저로 올라 AI학습용 데이터 프로젝트 전반을 관리하고 있다. B씨는 "(데이터라벨링은) 난이도가 낮은 작업도 있지만, 어떤 프로젝트는 어렵다"며 "작업자 개개인이 마음먹기에 따라 새로운 기회가 있다"라고 전했다.

주부 C씨는 자녀가 모두 대학생이 되자 새로운 경력으로 데이터라벨링에 도전장을 내밀었다. 과거 IT업계에 근무했던 C씨는 "이제 아이를 다 키운 입장에서 (데이터라벨링을 통해) 단순 아르바이트 이상의 수입도 원하고 있다"며 "과거 경험을 살리고 숙련도를 높여 AI전문가로 나설 것"라고 밝혔다.

데이터라벨링으로 AI프로젝트를 맛본 타직군의 시너지 효과도 기대되고 있다. 다른 사업과 융합에서 새로운 가치를 창출하는 AI기술과 맞아떨어지는 것이다.

현재 S대 법학전문대학원 재학생 D씨는 정보산업 전문 변호사가 목표다. D씨는 AI와 데이터 산업에 관한 이해도 증진을 위해 데이터 라벨링 프로젝트에 참여했다. D씨는 "교내 AI동아리는 부담스러워 참여하지 못했다"며 "자연스럽게 AI산업 구조를 이해할 수 있던 기회"라고 말했다.

디지털 격차를 몸소 느끼는 노년층도 데이터라벨링을 통해 막연했던 AI에 대한 이해도가 높아졌다는 평가했다. 최근 은퇴한 E씨는 "AI는 다 알아서 처리해주는 것으로 알았다"며 "사람이 라벨링으로 데이터를 가르쳐준다는 것을 알게 됐다. AI에 관한 이해도가 높아진 느낌이다"라고 전했다.

<용어설명> AI학습용데이터 구축 사업(데이터라벨링)

AI학습용데이터 구축 사업과 관련된 자세한 내용은 정부 AI허브에서 누구나 접할 수 있다. 현재 128개 기업이 약 2만2000개에 이르는 작업자를 구하고 있다.

송주상 기자 sjs@chosunbiz.com


T조선 뉴스레터 를 받아보세요! - 구독신청하기
매일 IT조선 뉴스를 받아보세요 닫기