버즈니가 운영하는 모바일 홈쇼핑 포털 앱 '홈쇼핑모아'는 총 16개 채널의 상품을 제공한다. 홈쇼핑모아에는 매일 새 상품 정보 약 800개가 업데이트된다. 매일 800개의 상품 정보를 인간이 분류한다면, 회사 운영에 큰 부담이 된다. 남상협 버즈니 대표는 SVM(Support Vector Machine)을 이용해 상품 분류를 자동화 했다. SVM을 활용하면 'scikit-learn' 등의 라이브러리를 활용할 수 있고, 어떤 피처(Feature)가 어떻게 영향을 미치는지 알 수 있다.

선형(Linear) SVM 개념 설명도 / 마이크로소프트웨어 391호 발췌
선형(Linear) SVM 개념 설명도 / 마이크로소프트웨어 391호 발췌
조현제 버즈니 데이터랩스팀 선임연구원은 카테고리 분류기 개발 과정에서 발행하는 이슈로 카테고리 체계를 꼽았다. 홈쇼핑모아에 등록된 상품은 약 1억 개지만, 상품 데이터을 제공하는 회사별로 카테고리 분류법이 달랐다. 브랜드명 자체가 카테고리인 경우도 있고, 여성 '원피스'의 경우 '여성 트렌드 의류' 또는 '여성 브랜드 의류' 등 회사별로 표현법이 다른 경우도 있었다. 결국 홈쇼핑모아의 카테고리 분류체계를 별도로 만들었다.

카테고리 분류기는 크게 텍스트와 이미지 두 가지 정보를 활용했다. 버즈니 개발자들은 이미지 정보의 활용법을 찾는 데 어려움을 겪었다. 버즈니 개발자들은 여러 테스트를 거쳐 구글(Google)에서 공개한 딥러닝 기법인 'Inception' 모델을 활용해 이미지 카테고리 분류 모델을 트레이닝했다.

버즈니는 카테고리 분류기로 자동화 시스템을 도입해 업무 시간을 단축했다. 남상협 대표와 조현제 선임연구원의 개발기는 '마이크로소프트웨어 391호(www.imaso.co.kr/archives/1301)'에서 확인할 수 있다.