[AI는 일자리다] 데이터 댐에서 시작하는 AI백년대계(하)

송주상 기자
입력 2020.11.06 06:00
(상) '2만 데이터라벨러 양성' AI데이터 산업은 일자리 보고(寶庫)
(중) 데이터라벨링, 범국민 AI네이티브 '초석'

‘인공지능(AI)이 일자리를 모두 빼앗을까?’ AI도입으로 일자리가 사라지는 사례가 나타나며 우려가 이어지고 있다. 하지만 AI 도입에 소극적인 태도는 안 된다. 이미 글로벌 트렌드다. 정부 역시 디지털 뉴딜을 통해 AI산업 키우기에 나섰다. 디지털 뉴딜의 중심인 AI학습용데이터 구축 사업을 3회에 걸쳐 살펴본다.

지난 7월 정부는본격적인 K-뉴딜(한국판 뉴딜) 시작을 알렸다. 2025년까지 총 160조원이 투입될 예정이며, 190만개가 넘는 일자리를 만든다는 목표다.

K-뉴딜 사업을 지탱하는 축 중 하나인 디지털 뉴딜은 ‘데이터댐’을 중심으로 DNA생태계(데이터-네트워크-인공지능)를 조성해 교육, 의료, 기업, 나아가 정부도 디지털로 변화한다. 사회 전반에 걸쳐 AI 기반 디지털 융합을 끌어내는 것이다. 그 중심에는 ‘인공지능(AI)학습용데이터 구축 사업’이 있다.

‘현장 맞춤형 데이터’ 2025년까지 700종 이상의 고품질 AI학습용데이터 구축

디지털 뉴딜과 마찬가지로 AI학습용데이터 구축 사업도 2025년까지 이어지는 중장기 사업이다.

2022년까지는 올해 사업과 마찬가지로 꾸준히 학습용데이터 확보에 나선다. 2021년 150종, 2022년 400종으로 총 700종 이상의 AI학습용데이터를 목표로 한다. 이번 사업 전담 기관인 한국정보화진흥원(NIA)의 AI데이터추진단 기획팀이 이미 중장기 로드맵을 준비하고 있다.

AI학습용데이터 고도화로 일자리 확보는 물론, AI시대가 한 발 빠르게 온다. /아이클릭아트
데이터는 스타트업, 중소기업 등 AI산업 현장에서 필요로 하는 데이터와 분야를 중심으로 채워질 전망이다. 데이터라벨링이 노동집약적인 과정인 만큼, 규모가 작은 기업은 학습 데이터 확보에 큰 어려움을 겪고 있다.

현장에 적절한 학습 데이터를 제공하기 위해, NIA는 전문가로 구성된 별도 자문위원단을 운영하며 데이터 종류를 선정하고 있다. 또한 2021년 데이터 구축 사업에 앞서, 건강의료분야 신규 과제 제안을 받거나, 수요조사를 하는 등 이용자 동향 파악에 힘쓰고 있다.

AI학습용데이터 구축사업은 2023년부터 3년간 확보한 데이터 고도화에 나선다. 매년 최소 200종을 정비해 고품질 데이터 세트를 다량으로 확보한다. 고도화 과정을 통해, 농축산, 의료 등 지엽적인 분야에서도 상용화 할 수 있는 수준의 AI를 학습할 수 있을 것으로 기대된다.

2025년까지 구축되는 모든 AI학습용데이터는 AI허브에 공개된다. 누구나 사용할 수 있다. 디지털 뉴딜의 근본인 데이터댐이 완공되는 셈이다.

진정한 디지털 뉴딜, AI학습용데이터 확보에서 시작

1930년대 미국은 대공황을 이겨내기 위해 ‘뉴딜 정책’ 아래 대규모 토목 건설 사업에 나섰다. 그 결과 후버댐이 건설됐고, 미국 서남부 캘리포니아, 네바다, 애리조나 식수 문제가 해결됐으며, 미국은 대공황을 이겨냈다.

미국은 ‘일자리 확보’와 ‘경제 강국’ 두 마리 토끼를 잡은 것이다.

AI학습용데이터를 비롯 다양한 공공데이터가 채울 데이터댐도 후버댐과 같이 새로운 일자리와 디지털 강국으로 나아가는 발판을 제공할 것으로 기대된다.

일자리와 경제 강국, 두마리 토끼를 잡은 미국의 뉴딜 정책. 디지털 뉴딜도 이 두마리 토끼를 목표로 한다. 사진은 후버댐. /Pixabay
기존 데이터라벨러는 물론, 데이터 보안 전문가, 저작권·개인정보 관련 전문가인 데이터 관리사, 계속해서 학습하는 AI 품질을 유지·보수하는 전문가 등 데이터 산업을 중심으로 새로운 직업이 등장할 것으로 보인다.

고품질 AI 학습 데이터 확보로 B2B(기업 간 거래)사업에 머무는 수많은 AI서비스가 기대보다 빠르게 B2C(기업과 개인 간 거래)사업에 등장할 가능성도 크다. 또한 정부와 기업의 디지털 전환, 그리고 본격적인 AI 의무 교육이 시작되며 발 빠르게 AI산업이 자리 잡을 수 있다.

시작은 AI학습용데이터 구축 사업이다. 일각에서는 단순 일자리 사업이라고 평가했지만, 실상은 일자리 사업이자, AI시대 기간(基幹)산업의 토대를 닦는 사업이다.

AI학습용데이터 구축 사업의 주관기업으로 선정된 A기업 관계자는 "많은 정부 사업에 참여했다. 그동안 이해되지 않은 사업도 있었다"며 "하지만 이번 사업은 국내 AI발전을 위해 꼭 필요하다"라고 강조했다.

이어 그는 "확보한 AI학습용데이터는 다시 사회에 공개된다. 미래 AI산업의 씨앗이 되는 것"라면서 "책임감을 크게 느끼면서도, 수년 후 국내 AI산업이 기대된다"라고 전했다.

송주상 기자 sjs@chosunbiz.com


T조선 뉴스레터 를 받아보세요! - 구독신청하기
매일 IT조선 뉴스를 받아보세요 닫기