정부가 2021년 북한 정세 파악 도구로 인공지능(AI)과 빅데이터를 활용한다.

통일부는 2021년도 예산안에 ‘북한정보 빅데이터 및 인공지능 구축’ 사업을 새롭게 편성했다. 104억원 규모다. 남북협력기금을 제외한 일반 예산 사업 중 다섯 번째 크기의 사업으로, 매년 진행 중인 북한이탈주민 정착지원 사업을 제외하면 최대 규모다. 이번 사업이 신규 사업인 점을 고려하면 통일부의 올해 중점 사업으로 분석된다.

통일부 안내판 / 조선DB
통일부 안내판 / 조선DB
북한정보 빅데이터 및 인공지능 구축 사업은 북한정세분석 정책 중 하나다. 사업은 다양한 매체에 파편화된 북한 정보를 빅데이터화하고, 정리된 데이터를 바탕으로 AI를 구축해 믿을 수 있는 정보를 내놓는 것을 목표로 한다.

향후 통일부는 AI·빅데이터 분석 시스템 일부를 대국민 서비스로 공개할 예정이다. 2020년 4월 김정은 신변이상설과 같은 북한 관련 가짜 뉴스 확산 방지를 위한 행보로 풀이된다.

세부 사업은 총 5종이다. 각 사업은 ▲빅데이터 인프라 구축 ▲ 북한 자료 빅데이터화 ▲ 북한 관련 인공지능 학습용 데이터 구축 ▲ AI 기반 분석 시범모델 개발 ▲ 북한 빅데이터 관련 거버넌스 구축 등(모두 가칭)이다.

빅데이터 인프라 구축 사업과 북한 자료 빅데이터화 사업은 파편화된 북한 정보를 한 데 묶어 디지털화하는 사업이다. 정리할 수 있는 시스템의 밑그림이다. 빅데이터 인프라 구축 사업은 2년간 진행될 예정이며, 2022년에는 빅데이터 분석 모델 등을 개발해 포함할 예정이다. 또 북한 자료 빅데이터화 사업은 이미지, PDF 등으로 구성된 자료를 디지털화를 목표로 한다.

북한 관련 인공지능 학습용 데이터 구축 사업은 AI 학습에 활용하기 위해 북한 관련 사진과 영상 데이터 등 데이터를 표준화한다. 북한 전문가가 북한 정보 라벨링 작업을 하며, 정보 연관성 등을 고려해 정보에 가중치를 부여할 예정이다. 또한 북한 말뭉치 등도 조성해 북한 관련 AI 개발환경 조성에 나선다.

AI 기반 분석 시범모델 개발 사업은 빅데이터에서 지식으로서 가치 있는 정보를 내놓는 것을 목표로 한다. 현재 단어 검색 수준에 그치는 기술력도 문장 단위로 끌어올린다는 계획이다. 일차적인 목표는 북한의 자연재해 상황 또는 기후변화 분석 등이다. AI 모델이 북한의 보도, 세계 기상 기구, 국내 기상청 등의 정보를 종합한 자료를 바탕으로 예측 결과를 내놓는다.

마지막 세부 사업은 북한 자료를 공유하는 거버넌스 구축 구성을 목표로 한다. AI 기술과 빅데이터 구축과 더불어 국내 외부 연구기관 등과 협업할 수 있는 정보화 시스템 구축에 나선다.

AI를 활용한 북한 정세 파악은 다양한 형태로 분산된 수많은 북한정보에서 의미 있는 정보를 얻기 위한 시도다.

통일부 관계자는 AI 접목을 통한 북한 정세 파악 배경에 관해 "폐쇄적인 환경인 북한을 고려한 것"며 "북한과 솔직한 이야기를 주고받을 수 없는 환경에서 선제적으로 필요한 정보를 알아내기 위한 노력이다"고 말했다.

사업에 관한 자세한 내용은 이르면 3월 조달 계획과 함께 공개되며, 연내 시범 운영을 목표로 하고 있다.

송주상 기자 sjs@chosunbiz.com