[IT조선 유진상] 크리테오(대표 고시나)가 머신러닝 알고리즘의 혁신과 관련 연구 지원을 위해 1테라바이트(terabyte) 규모의 데이터셋(dataset)을 오픈소스 커뮤니티에 제공한다고 24일 밝혔다.

머신러닝이란 방대한 데이터를 분석하는 빅데이터 기술에서 한 단계 진보된 형태의 기술로 데이터의 패턴을 검증, 분석해 미래를 예측하는 기술이다. 이를 통해 데이터의 효과적인 분석 및 활용의 궁극적인 단계인 데이터에 기반한 행동 및 미래를 예측해 정확한 의사결정이 가능해진다.

이번 크리테오의 데이터셋 공개는 머신러닝의 연구와 발전을 위해선 학계와 업계가 실증적인 연구를 위한 대량의 데이터를 보다 많이 확보해야 하기 때문이다. 이에 따라 크리테오는 자사의 퍼포먼스 디스플레이 광고 집행 시 발생한 수백만 건의 클릭 피드백으로 구성된 대규모의 데이터셋을 공개했다. 이를 통해 머신러닝 분야 학계 연구 및 업계 기술 개발을 적극 지원해나갈 계획이다.

올리버 샤펠 크리테오 총책임 연구원은 “정확하고 빠른 머신러닝 알고리즘은 비즈니스뿐만 아니라 다양한 분야의 성공을 위한 핵심이 되고 있지만, 공개적으로 이용할 수 있는 데이터셋 없이는 관련 연구가 쉽지 않다”라며 “크리테오는 오픈소스 프로젝트의 적극적인 참여자로서 오픈소스 혁신을 돕기 위해 머신러닝 커뮤니티를 지원하고 있으며, 관련 기술 혁신을 최대한 끌어내고자 새로운 데이터 셋을 공개하게 됐다”고 설명했다.

특히 그는 “이번 공개를 통해 학계 커뮤니티 및 산업 전반에 혜택이 가기를 기대하며, 크리테오는 향후 머신러닝 기술을 발전시켜나가기 위해 업계와 협력을 지속해나갈 것이다”고 전했다.

유진상 기자 jinsang@chosunbiz.com