입력 2021.01.20 12:05
페이스북과 인스타그램이 새해를 맞아 더 똑똑해진다. 시각장애인을 위해 이미지 내용을 더 정확히 분석해 설명하는 개선된 AI 음성사진설명 기능을 선보인다.
페이스북은 2016년부터 시각장애인용 음성기능에 대한 필요성을 인지했다. 이 기능에는 자동대체테스트(ATT)로 불리는 기술이 사용됐다. ATT는 2018년 미국 맹인 재단으로부터 ‘헬렌 켈러 상’을 수상하며 기대를 받았다.
페이스북은 2016년부터 시각장애인용 음성기능에 대한 필요성을 인지했다. 이 기능에는 자동대체테스트(ATT)로 불리는 기술이 사용됐다. ATT는 2018년 미국 맹인 재단으로부터 ‘헬렌 켈러 상’을 수상하며 기대를 받았다.

페이스북은 19일(현지시각) 개선된 시각장애인 보조 AI음성사진설명 기능을 공개했다. AI 음성사진설명 기능은 사진에서 안정적으로 감지하고 식별하는 능력을 10배 이상 강화했다. 게시되는 뉴스피드에서 음성 설명을 들을 수 있는 이미지 개수가 늘었다.
이미지 내 활동과 랜드마크, 동물을 식별할 수 있는 기능도 개선했다. 구체적인 랜드마크 명칭과 장소, 이미지 내 인원수와 이미지 촬영 시 동작을 이전보다 정확하게 설명해준다.
이미지 내 피사체 간 상대적 거리를 상세 설명하는 기술도 추가했다. 만약 이미지 내 촬영된 인물 5명 중 2명만 가까이 촬영됐다면 ‘가운데 가까운 2명, 가장자리에 흩어진 다른 3명’으로 설명하는 방식이다.
개인 설정을 통해 상세 설명 정도를 조절할 수 있는 옵션도 추가했다. ▲기본(Primary) ▲보조(Secondary) ▲약화(Minor) 등 기능을 통해 위치정보부터 이미지 내 물체 간 상대적 돌출 비교 정도를 선택할 수 있다. 설명되는 음성텍스트는 세계 45개 언어로 제공된다.
페이스북은 "페이스북과 인스타그램 사용자는 매일 수십억장 사진을 공유한다"며 "카메라 보편화로 인해 쉬운 촬영과 공유가 가능해졌지만, 시각장애인 이용자의 경우 격차를 느낄 수 있었다"고 말했다.
이어 "시각장애인을 위한 더 정확한 기능을 제공하기 위해 다양한 지역의 이미지를 수집하고, 세계 여러 언어를 사용할 수 있도록 모델을 조정했다"고 덧붙였다.
이민우 인턴기자 minoo@chosunbiz.com
이미지 내 활동과 랜드마크, 동물을 식별할 수 있는 기능도 개선했다. 구체적인 랜드마크 명칭과 장소, 이미지 내 인원수와 이미지 촬영 시 동작을 이전보다 정확하게 설명해준다.
이미지 내 피사체 간 상대적 거리를 상세 설명하는 기술도 추가했다. 만약 이미지 내 촬영된 인물 5명 중 2명만 가까이 촬영됐다면 ‘가운데 가까운 2명, 가장자리에 흩어진 다른 3명’으로 설명하는 방식이다.
개인 설정을 통해 상세 설명 정도를 조절할 수 있는 옵션도 추가했다. ▲기본(Primary) ▲보조(Secondary) ▲약화(Minor) 등 기능을 통해 위치정보부터 이미지 내 물체 간 상대적 돌출 비교 정도를 선택할 수 있다. 설명되는 음성텍스트는 세계 45개 언어로 제공된다.
페이스북은 "페이스북과 인스타그램 사용자는 매일 수십억장 사진을 공유한다"며 "카메라 보편화로 인해 쉬운 촬영과 공유가 가능해졌지만, 시각장애인 이용자의 경우 격차를 느낄 수 있었다"고 말했다.
이어 "시각장애인을 위한 더 정확한 기능을 제공하기 위해 다양한 지역의 이미지를 수집하고, 세계 여러 언어를 사용할 수 있도록 모델을 조정했다"고 덧붙였다.
이민우 인턴기자 minoo@chosunbiz.com
키워드
Copyright © IT Chosun.