아마존 음성 비서 알렉사(Alexa)가 더 똑똑해진다. 아마존은 음성 비서가 복잡한 질문에도 정확한 답변을 할 수 있도록 성능을 개선했다.

아마존 알렉사 인공지능(AI)팀은 7월 31일(현지시각) 블로그를 통해 텍스트 검색과 지식 그래프를 결합한 인공지능 학습법 연구 성과를 발표했다.

아마존 알렉사. / 알렉사 개발자 유튜브 갈무리
아마존 알렉사. / 알렉사 개발자 유튜브 갈무리
연구진은 알렉사에게 "놀란 영화 중 오스카상을 수상했지만 골든글로브상은 놓친 작품이 무엇인가"라고 물으면 ‘인셉션’이라는 정답을 말한다고 했다.

음성 비서가 해당 질문에 정확하게 답하려면 문장에 사용된 단어들의 관계를 이해해야 한다. ‘놀란’이 크리스토퍼 놀란 감독을 의미하는 걸 인지하는 게 우선이다. 그가 감독을 맡은 작품 목록을 파악하고 역대 수상 내역을 확인하는 과정도 필요하다. 아카데미 명단에는 있지만 골든 글로브에는 없는 작품을 구분하는 능력을 갖춰야 한다.

연구진은 복잡한 질문을 해결하기 위해 두 가지 학습법을 결합한 시스템을 사용했다. 컴퓨터가 질문에 답변하는 시스템은 ‘텍스트 검색’과 ‘지식 그래프’ 방식으로 나뉜다. 텍스트 검색은 우리가 인터넷 검색창에 질문을 입력하는 것과 비슷하다. 지식 그래프는 검색어와 연관성 있는 정보를 함께 보여주는 방식이다. 연구진은 두 방식을 조합해 개별 학습법의 한계를 보완하고 답변 정확도를 높였다.

알렉사에게 질문을 하면 인공지능은 우선 텍스트 검색을 한다. "놀란 영화 중 오스카상을 수상했지만 골든 글로브상은 놓친 작품이 무엇인가"라는 질문을 검색 엔진에 넣고 상위 10개 문서를 수집·분류하는 식이다. 수집된 데이터는 즉석(ad hoc) 지식 그래프를 만드는 데 사용된다.

지식 그래프에서 초석(주황색)을 표시한 모습. 정답(파란색)과 연관성이 낮은 데이터(회색)은 지워진다. / 아마존 알렉사 블로그
지식 그래프에서 초석(주황색)을 표시한 모습. 정답(파란색)과 연관성이 낮은 데이터(회색)은 지워진다. / 아마존 알렉사 블로그
연구진은 지식 그래프에서 ‘초석’을 골라내기 위해 자체 알고리즘을 적용했다. 초석은 질문에 사용된 개별 단어들과 밀접한 관계를 가진 단어를 말한다. 알고리즘은 초석들 간 거리와 가중치를 고려해 정답과 연관성이 낮은 데이터를 지워나간다. 이러한 과정을 반복하다 단어가 하나 남았을 때, 알고리즘은 남은 단어를 답변으로 선택한다. 예시 질문에 적용하면 ‘인셉션’이 마지막 단어에 해당한다.

이번 연구로 음성 비서의 활용도가 높아질 전망이다. 연구를 이끈 과학자 압달가니 아부자발(Abdalghani Abujabal)은 "최첨단 학습법을 발견했지만 아직 개선의 여지는 있다"며 "새로운 검색 알고리즘을 지속 개발하겠다"고 말했다.