MS, 보고서 통해 공개

사람보다 정확히 이미지를 묘사하는 인공지능(AI) 기술이 개발됐다. 시각 장애인 보행 보조는 물론 다양한 분야에 활용이 기대된다.

19일(현지시각) 복수 외신에 따르면 마이크로소프트(MS)가 새로운 이미지 캡션 AI를 공개했다. 공개한 보고서를 보면, 별도의 명칭 없이 AI가 사람과 비슷하거나 뛰어넘는 상황 묘사 기능을 갖췄다.

 정확한 사물 인식을 기반으로 한 설명이 인상적이다. /마이크로소프트
정확한 사물 인식을 기반으로 한 설명이 인상적이다. /마이크로소프트
기존 이미지 캡션 AI보다 평균 2배 이상 뛰어난 벤치마크를 기록했다. 예를 들어 기존 AI가 ‘길거리에 노란 불빛’라고 설명하던 이미지도 MS의 AI는 ‘기둥 위에 있는 전구’라고 묘사한다. 색깔이나 형태 등을 통한 개괄적인 설명 대신 정확한 사물 인식을 기반으로 이미지를 설명하는 것이다.

이미지 캡션 기술은 정교한 이미지 인식을 기반으로 특정 이미지를 설명하는 기술이다. 데이터 라벨링 과정에서도 자주 쓰이지만, 기술 자체로도 시각장애인 등 시각 약자를 돕거나 이미지를 텍스트로 바꾸는 AI서비스 등을 꾀할 수 있는 중요 분야로 꼽힌다.

MS는 이번 AI를 마이크로소프트 워드, 아웃룩 등 자사 솔루션에 올해 말 업데이트 예정이다. 또한 애저 제품군에도 추가되며, MS가 개발하는 시각장애인을 위한 AI ‘보는AI(seeing AI)에도 포함된다.

 연구 결과에 따르면, 인간보다 미세하게 뛰어나거나 비슷하다. /마이크로소프트
연구 결과에 따르면, 인간보다 미세하게 뛰어나거나 비슷하다. /마이크로소프트
송주상 기자 sjs@chosunbiz.com