음성인식 스피커나 챗봇을 만들기 위해서는 문장으로 된 정보 외에 기계가 스스로 내용을 분석하고 결과를 제시할 수 있는 형태의 데이터가 있어야 한다. 개인이나 기업이 이 데이터를 쌓기위해 새롭게 지식사전을 만드는 것은 현실적으로 불가능하다. 기존의 백과사전 지식을 활용해야한다. 디지털로 저장돼 누구나 제한없이 사용할 수 있는 백과사전은 위키피디아가 유일하다. 그런 의미에서 위키피디아의 중요성은 단순한 집단지성을 넘어, 개발자들에게도 매우 높다고 할 수 있다.

위키미디어 재단은 위키피디아의 데이터를 기계 가독(Machine Readable) 데이터로 정리하고 누구나 활용할 수 있도록 위키데이터 프로젝트를 운영하고 있다. 2012년 위키데이터 설립 당시 앨런 인공지능 연구소, 무어 재단, 구글 등이 주요 출자사로 참여했다. 이들의 주요 사업분야는 인공지능, 데이터과학, 검색엔진이며 시맨틱 웹과도 높은 관련성을 가지고 있다.


이만재 한국위키미디어협회 이사장은 파이썬을 이용해 위키피디아 탐험 프로그램을 만들었다. / 마이크로소프트웨어 388호 제공
이만재 한국위키미디어협회 이사장은 파이썬을 이용해 위키피디아 탐험 프로그램을 만들었다. / 마이크로소프트웨어 388호 제공
위키데이터는 위키피디아를 비롯한 거대한 위키프로젝트들에서 체계적으로 추출된 지식 요소들이 유입되며 양적으로 급격한 성장을 이어가고 있다. 가장 큰 규모의 시맨틱웹 구현체로서 방대한 데이터를 바탕으로 인간의 복잡한 질의에 답변을 해내는 인공지능의 핵심축이 될 것이다.

이만재 한국위키미디어협회 이사장과 김정민 KT 클라우드 사업팀 엔지니어가 위키피디아와 위키데이터를 다룬 개발기는 '마이크로소프트웨어 388'호에서 확인할 수 있다.