인공지능(A)기업 마인즈랩이 코로나19 확진자 경로 시각화를 위한 국내 최대 규모의 데이터셋을 오픈소스로 공개했다고 19일 밝혔다.

마인즈랩이 공개한 ‘코로나19 동선 추적 데이터셋’은 AI 모델 개발 등 기계학습에 필요한 데이터 집합이다. 확진자의 경로, 연령, 성별, 진단 날짜 등 기초적인 데이터부터 22가지의 주요 전염병, 16개의 백신, 의료 시설 등 의료 통계 데이터와 다양한 변수에 따른 시각화된 데이터를 포함한다.

마인즈랩이 공개한 코로나19 데이터셋 구현화면. / 마인즈랩 제공
마인즈랩이 공개한 코로나19 데이터셋 구현화면. / 마인즈랩 제공
해당 데이터셋은 기존 코로나19 관련 오픈 데이터셋들에 비해 양과 품질 그리고 데이터 시각화 부분에서 차별성을 갖는다. 미국의 커뮤니티 사이트 레딧(Reddit)의 개발/딥러닝 부문 1위에도 올랐다. 코로나19 동선 추적 오픈 데이터셋은 깃허브(Github)을 통해 누구나 이용할 수 있다.

이중건 마인즈랩 브레인팀 선임 연구원은 "공익적 가치를 고려해 누구나 쉽게 사용할 수 있도록 오픈 소스로 공개했다"며 "빠르게 확산하고 있는 코로나19를 막기 위해 최전선에서 사투를 벌이는 의료진과 관계자들에게 큰 도움이 되기를 바란다"고 밝혔다.