엔씨소프트의 인공지능(AI) 연구조직 엔씨 AI가 16일 멀티모달 AI 모델 ‘바르코 비전 2.0’ 시리즈 4종을 오픈소스로 공개했다. 

 ‘바르코 비전 2.0’ 14B 모델의 벤치마크 결과. / 엔씨 AI 
 ‘바르코 비전 2.0’ 14B 모델의 벤치마크 결과. / 엔씨 AI 

공개된 모델은 ▲14B ▲1.7B ▲1.7B-OCR ▲멀티모달 임베딩 등 4종이다. 이날 14B 모델과 임베딩 모델이 먼저 공개됐고, 나머지 2종은 다음 주 순차 출시된다.

엔씨 AI는 오픈소스 텍스트 모델을 기반으로 추가학습을 통해 멀티모달 모델을 구축했다. 4종은 텍스트와 이미지, 영상 정보를 이해하는 차세대 모델로 한국어 특화 성능과 글로벌 경쟁력을 갖췄다는 평가다.

엔씨 AI에 따르면 14B 모델은 InternVL3-14B, Ovis2-16B, Qwen2.5-VL 7B 등 글로벌 VLM(비전언어모델)을 다양한 벤치마크에서 능가했다. 특히 복잡한 문서나 표, 차트를 동시에 분석할 수 있는 점이 강점으로 꼽힌다.

OCR 모델은 다양한 해상도의 이미지를 분할 입력 방식으로 처리하며 흐릿하거나 혼합 언어 환경에서도 높은 인식률을 보였다. 임베딩 모델은 텍스트·이미지·영상 간 의미 유사도를 분석해 고성능 검색 기능을 구현했다.

4종 모델은 클라우드뿐 아니라 개인 디바이스에서도 사용 가능하다. 금융, 교육, 제조, 콘텐츠 등 다양한 분야에 적용될 수 있으며 문서 자동 처리와 비디오 검색, 광고 문구 생성 등에 활용될 전망이다. 엔씨 AI는 이번 모델 공개를 통해 국내 AI 기술의 자주성과 접근성을 동시에 높일 계획이다.

이연수 엔씨 AI 대표는 “글로벌 트렌드가 텍스트만 처리하는 언어 모델에서 비전언어모델로의 전환이 가속화되고 있다”며 “이번 공개는 국내 AI 기술의 주권과 경쟁력을 입증한 사례”라고 말했다.

천선우 기자 
swchun@chosunbiz.com