‘빅데이터, 키(KEY)는 분석과 속도’ 컨퍼런스 현장

김선영 위세아이텍 상무

 

IT조선이 28일 개최한 ‘빅데이터, 카(KEY)는 분석과 속도’ 컨퍼런스에서 김선영 위세아이텍 상무는 ‘효과적인 공공 데이터 개방을 위한 시각화’라는 주제로 강연을 펼쳤다.

 

 

‘시각화(Visualization)’란 정보를 효율적으로 전달하기 위한 표현 기법을 의미하는데, 여기에 데이터가 결합된 데이터 시각화는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정을 말한다. 프리드먼(Friedman)의 정의에 따르면 데이터 시각화의 목적은 도표라는 수단을 통해 정보를 명확하고 효과적으로 전달하는 데 있다.

 

김 상무에 따르면 기존의 데이터 시각화는 마이크로소프트(MS)의 오피스 프로그램 ‘엑셀(Excel)’을 활용해 그래프나 차트로 나타내는 것에서부터 다차원 분석 도구를 활용하는 경우가 대부분이었다. 빅데이터가 대두되고 있는 최근에는 다양한 오픈소스 소프트웨어를 활용하는 방식으로 나아가고 있는 추세다.

 

공공 데이터 개방에 시각화를 중요하게 언급한 이유는 여전히 일반인들이 접하는 데이터의 정보 공개 방식 수준이 발전하지 못하고 있기 때문이다. 개발자가 이용할 수 있는 데이터 공개 건수는 오픈API 등 날로 늘어나고 있지만, 데이터가 아닌 활용하기 힘든 통계 정보가 많다는 점도 걸림돌이다.

 

때문에 실제로 다양한 공공 데이터 시각화를 위한 노력이 펼쳐지고 있다. 디지털예산회계시스템의 경우 누구나 보기 쉬운 표 형태뿐 아니라 다양한 그래픽 형태를 통해 어떤 분야의 예산 규모가 큰지, 어떤 분야가 증가했는지는 바로 인지할 수 있도록 했다.

 

서울시 열린 데이터광장이 제공하는 대기오염 정보도 직관적인 이미지와 다채로운 컬러를 기반으로 일평균대기오염 수준을 누구나 알기 쉽도록 표현했다.

 

김 상무는 수백 종의 다양한 화면을 제공하는 오픈소스 시각화 그래픽이 매일 새로운 화면을 추가하고 비정형 데이터, 3D 영역까지 확장하며 전 세계적으로 확산되고 있다고 강조했다. 대학, 연구소 등에서의 정보 교환 목적에서는 물론, 뉴욕타임즈와 같은 언론사, 각국 정부 기관들도 활발하게 이용하고 있는 것으로 알려진다.

 

단, 저작권, 개발지식, 데이터 연결 문제 등의 이슈를 해결해야 한다는 점이 숙제로 남는다. 오픈소스 화면 하나하나마다 라이선스 정책을 따져봐야 하고 소스코드를 직접 다룰 수 있어야 한다는 점, HTML5를 지원하는 브라우저에서만 사용 가능하다는 점 등의 문제점도 걸림돌이다.

 

김 상무는 공공 데이터 개방을 위한 시각화를 통해 지자체간 칸막이를 해소하고, 시각화를 이용한 지역간 차이를 인지함으로써 종국에는 빅데이터 기반의 정부정책수립의 발판이 될 것으로 내다봤다.

 

노동균 기자 yesno@chosunbiz.com

상품지식 전문뉴스 IT조선