"문서들이 실제로 활용되지 않는다면 데이터라고 보기 어렵습니다."
정지환 한글과컴퓨터(이하 한컴) 개발본부장(CTO)은 27일 서울 웨스틴조선 호텔에서 열린 ‘AI&CLOUD 2024 콘퍼런스’에서 ‘인공지능(AI)으로 만드는 전자 문서 생태계의 혁신과 미래’라는 주제 발표에서 “과거에는 문서가 생산되고 유통되는 것에 그쳤지만, 최근에는 문서가 데이터 그 자체로 역할이 확대됐다"며 이같이 말했다. 문서를 보다 잘 데이터화하고 활용이 용이하게끔 하는 것이 중요하다는 설명이다.
마켓앤마켓 보고서에 따르면 2030년 전 세계 AI 시장 규모는 1조3452억달러(약 1934조원)까지 성장할 것으로 예상된다. 지난해에 국내에서도 약 41% 회사가 이미 AI를 도입, 활용하고 있다는 설명이다.
정 CTO는 AI 열풍과 함께 문서 활용에 대한 인식의 변화가 찾아왔다고 설명했다. 그는 “많은 기업이 AI를 자사 제품과 서비스에 연동하게 되며 ‘AI가 보다 더 정확한 정보를 줄 수 있고 똑똑해질 수 있는 부분이 없을까’라고 고민하게 됐다”고 설명했다.
그는 “AI가 더욱더 특화된 정보를 바탕으로 전문적인 답변을 하는 것이 필요하기 때문에 ‘검색 증가 생성(RAG) 기술’이 다시 주목받게 됐다”고 분석했다. RAG는 거대언어모델(LLM)이 답변을 생성하기 전 외부 데이터베이스에서 관련 정보를 검색하는 과정으로, 할루시네이션(환각) 현상을 줄이는 데 효과적이다.
정지환 CTO는 “한컴은 AI 열풍에 맞춰 AI 전략을 수립하고, 사업 성장을 위해서 지속적으로 기술 실현을 하는 중”이라면서, 한컴의 전자 문서 생태계 혁신 전략으로 ▲AI 전용 문서 데이터 추출 소프트웨어 개발 키트(SDK) ▲한컴 어시스턴트 ▲한컴 도큐먼트 QA ▲한컴독스 AI 정식 론칭 등 네 가지를 제시했다.
SDK는 문서 서식을 고려한 정확한 데이터 추출 및 분리뿐 아니라, 메타 데이터를 추가로 제공하고 있다. 메타 데이터는 AI 학습에 있어서 보다 더 정확한 동작 그리고 똑똑하게 수행하기 위해서 필요한 기타 출원 정보다. 개발 마무리 단계 중이라 조만간 정식 런칭 예정이다.
한컴 어시스턴트는 LLM을 통해 사용자의 명령 의도를 미리 파악하고, 자동으로 고차원적인 기능을 수행해서 문서 작성을 도와주는 솔루션이다. 올 상반기 내 베타 버전 출시를 준비하고 있다. 서비스형 소프트웨어(Saas)인 한컴독스 AI도 오는 8월 중 정식 출시될 예정이다.
한컴 도큐먼트 QA는 공공기관 및 기업내에 다량의 한글 문서와 기타 전자 문서들을 데이터로 활용할 수 있게 하는 솔루션이다. 정 CTO는 “(도큐먼트 QA는) 사용자의 다량의 문서를 이해해서 고객이 원하는 부분에 대한 질의에 답변함으로써 정보를 재생산할 수 있게 한다”고 설명했다.
정지환 CTO는 “이처럼 올해 한컴은 전자문서 생태계의 혁신을 가져올 많은 기술 라인업을 확보하게 된다”며 “고객의 요구에 맞는 체계적인 기술과 최고의 효율적인 솔루션을 제공할 것”이라고 마무리했다.
김경아 기자 kimka@chosunbiz.com