마이크로소프트(MS)의 인공지능(AI) 음성 인식 기술이 사람과 동등한 수준으로 올라섰다.

18일(현지시각) 미국 IT 전문매체 더버지는 MS 공식 블로그를 인용해 "MS의 AI 음성 인식 기술이 전문적으로 사람의 말을 받아쓰는 구술기록자의 수준"이라고 보도했다. 대화를 90% 이상 알아들을 수 있다.

MS 음성∙대화 연구그룹 / MS 홈페이지 갈무리
MS 음성∙대화 연구그룹 / MS 홈페이지 갈무리
MS에 따르면 AI 음성 인식 기술이 단어를 잘못 이해하는 것은 5.9%에 불과했다. 인간이 대화를 듣고 기록할 때도 5.9% 정도의 오류는 발생한다는 것이 MS의 설명이다. 즉 MS의 AI 음성 인식 기술이 사람과 같은 정도라는 것이다.

AI 음성 인식 기술이 놀라운 발전을 이뤘지만, 아직 갈 길이 멀다. MS는 다양한 음성을 연구실이 아닌 실제 상황에서 분별할 수 있도록 음성 인식 기술의 정확도를 높이는 연구를 진행할 계획이다.

MS는 이번에 개발한 기술을 PC 운영체제(OS) 윈도와 콘솔게임지 엑스박스(Xbox) 등 음성 비서 '코타나'가 탑재된 시스템에 적용할 계획이다.