리턴제로, 작년 4월부터 ‘비토’ 서비스
아틀라스랩스, 최근 ‘스위치’ 앱 출시
네이버도 ‘최고 기술’ 자랑하며 베타 서비스

#자영업자 최 씨는 사회적 거리두기로 부쩍 통화 상담이 늘었다. 민감한 계약도 통화로 진행된다. 하지만 최 씨는 늘어난 통화량에도 걱정이 없다. 통화·음성 기록 앱이 자동으로 글로 변환해 준 덕이다.

코로나19 확산에 따라 비대면 환경 조성이 조성됨에 따라 업무상 전화 통화를 이용하는 경우가 확 늘었다. 최근 전화 통화 내용을 녹음한 후 이를 글(텍스트)로 자동 변환해주는 통화·음성 기록 앱이 주목을 받는다. 통화·음성 기록 앱은 인공지능(AI) 기술을 통해 구현된다. AI는 네트워크 상태나 통화기기 등 환경에 따라 변하는 통화 품질을 고려해 음성을 인식한 후 텍스트로 내용을 저장한다.

통화·음성 기록 AI 서비스는 2020년초부터 콜센터를 중심으로 B2B 시장에 공급됐다. 이들 서비스는 AI기술 발전과 개인 이용자의 요구에 따라 B2C 시장에 진출했다.

 새해 초 AI서비스 경쟁이 통화·음성시장에서 시작한다. /iclickart
새해 초 AI서비스 경쟁이 통화·음성시장에서 시작한다. /iclickart
시장은 스타트업이 열었다.

이미 리턴제로의 '비토'가 통화·음성 기록 앱 중 눈에 띄는 활약 중이다. 2020년 4월 출시된 비토는 일 년도 안돼 가입자 15만명을 돌파했다. 누적 통화 건수는 1억건 이상이다. 비토는 출시 직후 텍스트 전환의 정확도가 떨어진다는 이유로 구글스토어 평균 평점이 3점대로 떨어졌다. 하지만, 꾸준한 고도화로 현재 평점 4.5점을 기록하며 안정적인 서비스라는 인정을 받는다.

비토는 통화를 자동으로 녹음한 후 말뭉치 형태의 텍스트로 음성을 변환한다. 개인 메신저처럼 저장된 텍스트에서 필요한 단어를 검색하거나 캡처하는 기능도 지원한다. AI가 잘못 인식한 텍스트는 사용자가 말뭉치를 클릭해 직접 수정하거나 새로 인식시킬 수 있다. 말뭉치 선택 시 해당 지점에서 통화 녹음이 시작되는 기능이 가장 인기 있는 기능이다.

이참솔 리턴제로 대표는 "비대면 근무 환경이 확산하며 평소보다 통화량이 늘었다"며 "늘어난 통화량을 모두 녹음하고 정리하는 일은 쉽지 않아, 클라우드를 추가할 예정이다"고 말했다. 이어 그는 "이용자가 도와준 덕분에 서비스 초기 시점보다 AI의 음성 인식률이 높아졌다"며 꾸준한 AI고도화를 약속했다.

통화 녹음 기능이 없는 아이폰에서도 활용할 수 있는 통화·음성 기록 앱도 있다. 아틀라스랩스는 최근 iOS 운영체제에서 이용할 수 있는 ‘스위치’ 앱을 선보였다. 이 앱은 그동안 아이폰에서 음성 통화를 녹음할 수 없다는 한계를 극복한 앱이어서 관심을 받는다. 특히 ‘스위치 커넥트’로 모바일 앱의 텍스트 데이터를 PC·웹 등에서 확인할 수 있다는 점이 강점이다. 스위치 안드로이드 버전은 2월 나온다.

스위치가 이용하는 음성인식 AI기술 ‘제로스’는 아틀라스랩스가 직접 개발한 것이다. 제로스는 포스코ICT, 오뚜기, 예스24, KT DS 등 다양한 기업이 이미 도입해 사용 중인 AI다.

류로빈 아틀라스랩스 대표는 "스위치 출시 이후 아이폰 커뮤니티 등에 소개되며 긍정적인 반응이 이어지고 있다"며 "통화 텍스트 데이터 분석 기능, 팀 협업 지원 기능 등을 추가해 스위치 커넥트를 강화하겠다"고 전했다.

그는 또 "스위치는 궁극적으로 사람 간 이해를 높이는 것을 목표로 한다"며 "생활 속의 새로운 변화를 만들겠다"고 덧붙였다.

국내 최고 수준의 AI기술력을 자랑하는 네이버는 2020년 11월 ‘클로바노트’ 베타서비스를 시작하며 음성기록 시장에 뛰어들었다. 클로바노트는 네이버 클로바의 음성인식AI ‘클로바 스피치’기반으로 개발됐으며 음성 인식률이 높다는 평가를 받는다. 클로바 스피치의 기술력은 세계 최고 음성신호처리 학회 인터스피치 등에서 인정을 받았다.

직관적인 인터페이스(UI)와 사용자경험(UX)도 앱 긍정 평가의 요인이다. 클로바노트는 서비스명처럼 공책(노트) 형식으로 통화 텍스트를 정리해서 보여준다. 또한 중요한 시점은 북마크해 쉽게 다시 들을 수 있으며, AI가 상대적으로 인식하기 힘든 고유명사도 미리 지정해 음성인식률을 높일 수 있다.

다만, 클로바노트는 통화 단계에서부터 자동 텍스트 변환 기능을 지원하지는 않는다. 사용자가 클로바노트 앱 내에 녹음된 통화를 지정해 별도 변환 과정을 거쳐야 한다.

네이버 관계자는 "클로바노트는 AI기술을 실생활에서 사용해 편리한 경험을 제공한다"며 "업계 최고 수준의 기술력이 가장 큰 차별점으로 음성 데이터가 제한된 상황에서도 음성 인식률이 뛰어나다"고 밝혔다.

송주상 기자 sjs@chosunbiz.com