마인즈랩 "코로나19 데이터셋 분야 세계 3위 달성"

입력 2020.06.24 17:28

24일 마음AI 세미나서 밝혀
각계서 코로나19 연구에 활용

"치아 교정하는 인공지능(AI), 파워 블로거 AI 등 맞춤형 AI를 만듭니다. 사람이 할 수 있는 일이라면 AI도 할 수 있다고 했던 약속을 지켜나가겠습니다"

최홍석 마인즈랩 기술 사업부문 대표는 24일 서울시 중구 대한상공회의소 국제회의장에서 열린 ‘2020 마음AI 세미나’에서 이같이 밝혔다.

올해로 3회째를 맞은 이번 세미나에서는 최신 AI 연구 결과, AI 서비스 구현에 필요한 기술, 서비스 구현 사례 등이 중점적으로 소개됐다.

마인즈랩이 공개한 ‘AI 아바타. 왼쪽 최상단이 최홍석 마인즈랩 기술사업부 부문 대표. / 마인즈랩 유튜브
세미나 시작은 손석희 JTBC 대표이사 사장의 인사말 영상으로 시작됐다. 뉴스를 진행하듯이 자연스럽게 세미나를 소개했지만, 실제로는 최 대표의 목소리와 표정 등을 입힌 영상이었다. 잘 알려진 ‘딥 페이크’ 기술 일환으로 최 대표를 찍은 영상을 AI가 학습해 손 사장의 모습으로 구현한 것이다.

마인즈랩 브레인팀은 얼굴 교체, 음성 전환 등 최신 AI 연구 성과를 토대로 이같은 ‘AI 아바타’를 생성했다. 얼굴 교체는 얼굴 움직임뿐만 아니라 눈동자 변화까지 재현해 경쟁력을 높였다. 음성 전환은 ‘Cotatron’이란 이름으로 국제 학회에 발표하는 등 기술력을 인정받았다.

이외에도 자동으로 교정기 위치를 예측하는 치아 교정, 오탈자를 감지해 문맥에 맞게 수정하는 문장 교정, 잡음 등에서 사람의 목소리를 추출하는 음성 향상, 사진이나 영상의 노이즈를 줄이는 해상도 증강 등 고도화된 AI 기술 성과를 발표했다.

최홍석 마인즈랩 기술사업부 부문 대표 / 마인즈랩 유튜브
마인즈랩은 국내 최대 코로나19 데이터셋 구축 사례도 소개했다. 이 데이터셋은 다운로드 수 30만 건을 달성, 세계적인 AI 데이터 플랫폼인 ‘캐글’에서 미국 백악관, 존스홉킨스대학교에 이어 3위를 차지하기도 했다. 또 하버드 메디컬 스쿨 등 20여 곳 이상 주요 기관, 9건의 논문에서 핵심 데이터셋으로 사용됐다.

데이터셋에는 확진자 이동경로 및 감염경로, 구별 유동인구 수, 건강검진 기록 등 코로나19와 관련된 다양한 정보가 사용됐다. 데이터 양 뿐만 아니라 이를 데이터 분석에 최적화된 형태로 바꿔서 데이터 품질을 높였다.

이중건 마인즈랩 브레인팀 팀장은 "세계 전역을 다루는 기타 데이터셋들과 달리 마인즈랩은 한국 정보만을 담았다"며 "그런데도 연구 가치를 인정받은 비결은 데이터 품질에 있다"고 설명했다.

마인즈랩은 올해부터 상반기 데이터 사업에 본격적으로 뛰어들었다. AI 서비스용 엔진에 적합한 초고품질 AI 데이터를 제공하는 것이 목표다. 최적화된 AI 성능을 내려면 단순히 많은 양의 데이터를 사용할 게 아니라 정제된 데이터를 사용해야 한다는 설명이다.

이종미 마인즈랩 데이터사업 총괄 상무는 "예를 들어 묵음 제거, 문장 분리 등 사소해 보일 수 있는 작업이 음성 전환 기술 성능을 좌우한다"며 "데이터 사업을 통해 고품질 데이터를 구축하는 한편 새로운 일자리 창출에도 기여할 것"이라고 밝혔다.

마음AI 세미나 현장 / 마인즈랩
마인즈랩은 작년 3월 맞춤형 AI 플랫폼 ‘마음AI’를 선보였다. 고객의 필요에 맞게 AI 기술과 서비스를 제공하는 플랫폼이다. 클라우드 기반으로 운영해 언제 어디서나 서비스 이용이 가능하다.

AI를 도입하고 싶지만 어려움을 겪는 이들이 마음AI를 찾았다. 현재 유료 구독자 수는 1500명이 넘는다. 플랫폼도 성장했다. 엔진 API는 출시 시점 대비 18개 증가한 27개, AI 서비스는 5개를 보유하고 있다.

최 대표는 "어떻게 하면 누구나 AI를 쉽게 사용할 수 있겠냐는 고민에서 마음AI를 시작하게 됐다"1년 남짓한 시간에 충분히 기술력을 증명했다고 생각한다"고 강조했다.

이어 "에코마인즈 파트너십 프로젝트를 통해 AI 도입을 모색하는 스타트업, 기관에 기술은 물론 재무까지 지원하며 효과적으로 AI를 활용, 성장할 수 있도록 적극 도울 것"이라고 말했다.

장미 기자 meme@chosunbiz.com



키워드