[미리보는 마소 390호] 알맹이 빠진 공공 데이터 개방

조병승 기자
입력 2017.10.23 16:45
2017년 7월 13일 행정자치부(이하 행자부)는 OECD가 발표한 '2017년 정부백서(Government at a Glance 2017)'를 인용해, 우리나라가 OECD 회원국 중 프랑스(2위)·일본(3위)·영국(4위)·멕시코(5위)를 제치고 공공데이터 개방지수에서 1위를 기록했다고 밝혔다. 공공데이터 개방지수는 가용성, 접근성, 정부지원 등 3개 분야로 산정한 점수 합계로 계산한다. e-나라지표의 '공공데이터 개방 및 활용 현황'에서도, 공공데이터 개방과 활용 수치는 2013년 5272건에서 2016년 2만1358건으로 성장세를 유지하고 있다.

월드와이드웹 재단(World Wide Web Foundation)에서는 매년 오픈데이터 바로미터(Open Data Barometer)를 발표하고 있다. 이 평가에서 한국은 종합 5위를 달성했지만, 세부 평가 항목들 중 구현 지수(Implementation)에서 59점(100점 만점)을 받았다.

공공데이터 개방을 위해 한국정보화진흥원은 행자부 지원을 받아 공공데이터포털(data.go.kr)을 운영하고 있다. 공공데이터포털은 국내 공공기관이 발행하는 2만건 이상의 공공데이터를 배포·관리하고 있다.

공공데이터포털이 관리하는 데이터에서 특수문자가 포함된 항목명을 다수 확인할 수 있다. / 마이크로소프트웨어 제공
김학래 한국과학기술정보연구원 연구자는 이들 데이터를 직접 수집해 분석한 결과를 공개했다. 공공데이터포털에 있는 2만건 이상의 데이터를 데이터 유형별로 파일명과 항목명을 추출해, 항목명에서 길이, 특수문자, 공백 등에 대한 빈도를 분석하면 데이터 품질을 가늠해 볼 수 있다. 분석 결과 데이터 항목명에 공백과 특수문자가 다량 발견됐고, 공공데이터 개방표준 정비가이드 기준을 따르지 않는 데이터들도 확인됐다.

김학래 박사가 분석한 공공데이터포털과 개선방향은 '마이크로소프트웨어 390호'의 '공공데이터포털 분석'에서 확인할 수 있다.

T조선 뉴스레터 를 받아보세요! - 구독신청하기
매일 IT조선 뉴스를 받아보세요 닫기