삼성전자 세트부문 선행 연구개발(R&D) 조직인 삼성리서치가 글로벌 인공지능(AI) 기계독해 테스트에서 연속 1위를 차지했다. 기계독해는 AI 알고리즘이 스스로 문서를 분석하고 질문에 대한 최상의 답안을 찾아내는 것을 의미한다.

 김지희 삼성리서치 언어이해랩장(상무). / 삼성전자 제공
김지희 삼성리서치 언어이해랩장(상무). / 삼성전자 제공
9일 삼성전자에 따르면 삼성리서치는 최근 마이크로소프트(MS)가 주최하는 ‘마르코(MSMARCO)’ 기계독해 테스트에서 선두에 올랐다. 또 미국 워싱턴대학교가 진행하는 ‘트리비아(TriviaQA)’ 테스트에서도 1위를 기록해 AI 알고리즘 우수성을 검증했다.

마르코와 트리비아는 미국 스탠포드대학 스쿼드(SQuAD), 딥마인드의 내러티브(NarrativeQA) 등과 함께 요즘 활발히 연구∙활용되는 기계독해 테스트 중 하나다. 삼성을 비롯한 글로벌 AI 기업과 각국 유수 대학이 테스트에 참가해 자웅을 겨룬다.

마르코, 트리비아의 경우 뉴스, 블로그 등 다양한 웹 문서가 통째로 제시되기 때문에, 웹 문서의 짧은 한 단락을 분석해 단답형 문제를 푸는 다른 테스트보다 고도화된 기술 역량을 필요로 한다.

예를 들어 마르코의 경우 특정 질문에 대해 10개 웹 문서를 제시하고 최적 답안을 스스로 생성토록 하는 형태로 진행한다. 질문은 MS 검색엔진 Bing에서 실제 사용자가 입력한 데이터에서 무작위로 100만개를 선정해 제시한다.

답안을 평가하는 것도 사람이 쓴 답과 얼마나 비슷한지 통계학적으로 검증하는 방식이다. AI 알고리즘을 현실에 적용할 수 있도록 고안한 테스트 방식인 셈이다.

삼성리서치는 콘즈넷(ConZNet)이라는 자체 AI 알고리즘으로 테스트에 참가했다. 콘즈넷은 강화학습(Reinforcement Learning) 기법을 적용해 역량을 높였다. 강화학습은 AI 핵심인 기계학습(Machine Learning) 중에서도 가장 고도화된 학습방법이다. 알파고를 비롯한 최신 AI 기술이 이 기법으로 지능을 고도화한다.

최근 AI 기술 경쟁이 가속화되면서 기계독해뿐만 아니라 컴퓨터비전(글자, 이미지를 스스로 인식∙분석하는 기술), 인식한 글자∙이미지를 문제풀이로 이어가는 영상(visual) 질의응답 등 분야의 글로벌 경연이 크게 확산되고 있다.

김지희 삼성리서치 언어이해랩 상무는 “실생활에서 이용자에게 간편하게 답변을 제공하도록 AI 알고리즘을 발전시켜 나가고 있다”며 “기술 개발과 함께 제품, 서비스, 고객대응 등에 AI 기술을 적용할 수 있도록 회사 내 논의도 활발하다”고 밝혔다.

한편 삼성리서치 베이징연구소는 3월 국제패턴인식협회(IAPR) 문자인식 대회(ICDAR)에서 1위에 올랐다. 또 글로벌 컴퓨터비전 테스트에서 선두권을 기록했다. ICDAR은 광학문자판독(OCR) 기술 부분에서 영향력이 가장 큰 대회다.